首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
如何从互联网Web页面中快速、准确获得用户感兴趣的数据内容成为信息抽取领域的研究热点.本文总结现有Web信息抽取分类方法,并提出按用户参与程度对Web信息抽取系统进行分类的方法,分为人工创建系统、用户监督系统和无人监督系统,并从7个方面对Web信息抽取系统进行分析、比较.  相似文献   

2.
针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF·IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量。  相似文献   

3.
基于本体(ontology)知识抽取的主要目标是研究如何从没有语义信息的非结构文档中抽取与领域本体匹配的知识,从而实现对知识充分、有效的利用。以农业知识为研究对象,提出一种利用本体从Web网页上提取知识的方法。首先利用自顶向下的方法建立农业领域本体,然后利用噪声消除算法去除噪音块,接着将农业领域本体解析的结果应用到中文分词、命名实体识别及知识抽取过程中,从而使得中文分词和命名实体识别的结果更准确,解决Web信息抽取系统中抽取结果缺乏语义信息的问题。最后,通过试验验证该抽取系统能够得到性能较高的抽取结果。  相似文献   

4.
基于DOM的Web信息抽取   总被引:6,自引:0,他引:6  
为解决因Web信息量巨大且具有动态性、不规则性,Web信息查询和Web信息集成存在很大困难,研究了对HTML格式的Web文档的信息抽取,提出了一种基于DOM的Web信息抽取方法。该方法通过附加语义、样本学习生成基于DOM路径的抽取规则,利用遍历DOM树实现信息抽取。本方法可用于Web查询,也可用于信息集成系统中包装器的构造。  相似文献   

5.
在分析查找互联网股票信息存在问题的基础上,给出了一个基于语义Web的股票信息表示模型.首先利用语义Web定义股票本体,给出了相应的RDF模式描述,对本体进行评估.其次,通过分析用户股票信息需求,利用构建的股票本体,给出基于语义Web的模型的体系结构,建立了一个能根据用户请求提供所需要的股票信息的股票信息表示模型;最后通过实例验证了该模型的有效性.  相似文献   

6.
张颖 《安徽农业科学》2012,(5):2968-2969
分析了传统农业商务门户Web信息检索技术存在的问题与不足,结合物联网信息的特点,提出基于本体的语义检索模型,提供面向农业的专业化检索服务。基于本体的智能信息检索方式灵活多样,能够对用户提供语义制导,有较强的推理能力,实现了基于知识的语义检索,并在此基础上实现了数据的高效率和高精度挖掘,根据挖掘结果进行决策分析,为用户提供基于RSS聚合的个性化服务。  相似文献   

7.
目前,民族文献信息化资源建设主要基于传统的文本和关键字检索技术,不能够准确理解用户的需求,缺乏语义理解和关联。笔者试从语义网(Semantic Web)技术条件下构建了基于本体的民族文献语义检索模型,并通过七步法设计了民族文献的关键本体,为民族文献信息资源数字化建设提供借鉴。  相似文献   

8.
针对用户个性差异向用户推荐适合于他们的内容已经成为Web技术的研究热点。Web挖掘是实现Web个性化推荐的关键技术之一。结合Web使用挖掘与Web内容挖掘技术,研究了网页的特征化表示和用户兴趣模型的表示,提出了一种基于Web挖掘的推荐算法,能够有效发现用户兴趣,提高推荐页面的准确率。  相似文献   

9.
本体在知识管理和语义网中扮演着越来越重要的角色,但本体的构建是一项费力又费时的工作,为此本文提出一种基于文本分类模式下的本体自动构建方法。该方法以形式化概念理论分析作为基础,计算出概念之间的相关度,以概念间的相关度和它们在文档中出现的频率矩阵构建本体概念图。实验结果表明,在文档分类模式下自动构建本体支持目前的信息分类系统,形成的本体有利于更好地共享和重用,促进语义Web的本体的升级。  相似文献   

10.
王政嘉  李征  王健 《河北农业科学》2012,16(1):99-102,106
作者根据农村互联网发展的现状,依托RSS为核心技术,同时结合移动互联网技术、页面信息抽取技术、个性化用户模型等技术,设计了支持移动设备的个性化农业信息服务系统,力求可以通过移动设备完整、及时、低成本地将农业信息传送给农户。  相似文献   

11.
为了识别用户浏览模式,实现利用关联规则挖掘算法Apriori对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行挖掘的模块,该模块针对用户选定的若干页面产生满足最小支持度和最小置信度的页面之间的强关联规则。关联规则挖掘结果对网站管理员重新调整网站结构、通过预测用户浏览模式提供推送服务来提高用户的访问效率和网站资源的利用率有一定的指导作用。  相似文献   

12.
王霞  李功振 《安徽农业科学》2010,38(35):20306-20308
在语义网以及本体技术的基础上,构建一种新的水环境评价系统来实现环境信息的集成、语义连接以及推理,其中包括网络服务提供者,网络服务请求者和Agent匹配器3部分组成。网络服务提供者是一类网络服务器,其建立在检测点数据库和水环境评价本体的基础上。网络服务请求者保证用户对机器服务的使用。Agent匹配器是在网络服务请求者和提供者之间联系一定的特定联系。重点介绍水环境评价模糊本体,其生成过程包括模糊形式概念分析,模糊概念聚类和模糊本体生成。模糊形式概念分析完成由检测点数据库中获取模糊检测概念格的工作,模糊概念聚类生成检测概念层次,最后由模糊本体生成过程产生水环境评价本体。研究的创新点是将传统水环境评价的单一系统通过语义网连接起来,提高环境信息的共享性和可重用性,从而进行有效的环境评价和正确决策。  相似文献   

13.
针对林产品商务Web信息整合的过程出现的林产品语义冲突、共享困难等问题,从现有的本体相关理论出发,使用本体的形式化定义形式,对林产品的概念进行语义形式化描述,确定林产品本体的六元组。进而建立了林产品的核心本体。并给出该本体的关联可视图。  相似文献   

14.
传统的人工智能采用不同的建模方法、开发工具进行知识表示,使得各种知识表示之间缺乏互操作性,本体的引入解决了这一问题。对基于本体的知识表示方法进行了探索,对玉米领域知识本体进行了构建。结果表明,本体可有效地解决复杂知识间表达的异构问题,使计算机对信息的理解升至为语义层次,利于玉米智能系统的研制。  相似文献   

15.
为了提高鱼类分类系统的复用率,需组合已有的各种鱼类分类Web服务,以生成满足用户需求的业务。在语义Web和本体的技术支持下,将以自然语言形式的鱼类信息转变为机器可理解形式的鱼类知识,利用本体的推理能力,生成服务组合图,基于该图,提出一种启发式的服务组合算法,并使用Java和Jena实现了该算法。程序运行结果表明,该方法不仅考虑了服务语义方面,还能根据web服务的组合经验,动态地调整web服务组合方案,提高了服务组合的适应性。  相似文献   

16.
肖彭燕 《湖南农业科学》2010,(8):154-156,166
为了提高鱼类分类系统的复用率,需组合已有的各种鱼类分类Web服务,以生成满足用户需求的业务。在语义Web和本体的技术支持下,将以自然语言形式的鱼类信息转变为机器可理解形式的鱼类知识,利用本体的推理能力,生成服务组合图,基于该图,提出一种启发式的服务组合算法,并使用Java和Jena实现了该算法。程序运行结果表明,该方法不仅考虑了服务语义方面,还能根据web服务的组合经验,动态地调整web服务组合方案,提高了服务组合的适应性。  相似文献   

17.
针对大多数现有关系抽取模型存在对语义特征提取不充分、速度慢且数据集匮乏的缺点,提出一种PCNN(piecewise convolutional neural network)模型和多层注意力机制相结合的远程监督关系抽取方法进行农业病虫害领域的关系抽取。模型由两个实体把句子分成三段,对卷积后的每一段进行最大池化获得特征,同时在实例和池化特征层面上分别引入注意力机制有效降低信息噪声。在F1评价指标上比传统方法提高了5.75%,在耗时上是传统方法的10.93%,且减少了手工标注数据集的成本。  相似文献   

18.
传统的信息检索是利用关键词匹配查询,对用户问句缺乏语义理解,检索效果不是令人非常满意。为解决此问题,提出了一种基于本体的分类检索系统,利用本体中丰富的语义关系,对用户提问进行分类语义查询,从而提高信息检索的查准率和查全率。  相似文献   

19.
农业信息化多种接入方式格式转换方法研究   总被引:1,自引:0,他引:1  
董素芬  滕桂法  高媛 《安徽农业科学》2010,38(12):6565-6566
互联网上的信息资源大部分都是针对电脑屏幕分辨率设计的,即在800×600或更高的分辨率下可以达到最佳效果,而农村用户通过电视机接入网络,由于屏幕分辨率较低,无法正常显示网页。以农村普及的电视为研究对象,针对低分辨率的电视机不能正常显示网页信息的问题,把网页分为导航页面和内容页面,针对于导航页面给出了采用缩略图进行网页格式转换的方法,并对网页缩略图转换进行了试验验证,证明了所给出方法能够有效的将现有的Web页面转换为适合于普通电视显示的页面。  相似文献   

20.
阐述了向量空间模型文本分类技术的基本思想。通过在传统的向量空间模型的基础上增加语义环境形成语义向量空间模型,用以体现领域本体概念之间的关系即语义属性。根据领域本体概念之间关系的不同层次论述了不同关系的不同权重计算方法,并且提出了单层语义向量空间模型的改进方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号