首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
关联规则中的Apriori挖掘算法改进   总被引:3,自引:0,他引:3  
关联规则挖掘是数据挖掘研究的一项重要内容。然而基于候选集的Apriori算法效率低下。针对此缺陷,提出了一种NApriori算法,该算法利用频繁1项集重新组织事务数据库来挖掘关联规则。此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,从而提高了挖掘效率。  相似文献   

2.
在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,将传统事务数据转换成二进制数,然后用数字的递增和递减两种方式双向搜索候选频繁项;算法通过序列数的度来计算支持数,实现一次扫描数据库,有效地提高了算法的效率.  相似文献   

3.
在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,将传统事务数据转换成二进制数,然后用数字的递增和递减两种方式双向搜索候选频繁项;算法通过序列数的度来计算支持数,实现一次扫描数据库,有效地提高了算法的效率.  相似文献   

4.
关联分析是数据挖掘的本质体现,关联规则挖掘就是寻找给定的大量数据项集之间存在的某种规律的过程。Apriori算法是关联规则中最重要的一种挖掘频繁项集的算法,但是它也存在一定的不足。目的为了提高挖掘效率。方法采用实验的方法,在经典Apriori算法的基础上进行改进。结果证明改进的Apriori算法性能优于经典的Apriori算法,尤其是在交易事务条数比较多的情况下,效果更加明显。结论是改进的算法在计算支持度个数时,每次不需要扫描全部数据库,只需要在精简的数据库表中扫描各项所在的行就可以了,大大节省了时间;支持度计数的统计也比较容易,也不会产生过多的冗余,可以在很大程度上降低挖掘的复杂度,提高挖掘算法的效率。  相似文献   

5.
关联规则挖掘在课程相关分析中的应用   总被引:1,自引:0,他引:1  
本研究介绍了关联规则挖掘的基本概念,分析了经典的Apriori算法,提出一种改进的关联规则挖掘算法,解决了挖掘课程相关性关联规则的问题。改进算法的基本思想:①采用位图数据格式;②系统中会永久保留支持度为0的候选1项集和候选2项集,当系统需要运行时,首先采用数据库的过滤技术,可以很快得到频繁2项集。突破了这一瓶颈,系统运行速度将得到较大的提升。将该算法应用于课程相关性分析,实验结果表明改进的算法性能优于Apriori算法。  相似文献   

6.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。  相似文献   

7.
土地评价中关联规则与C4.5规则的应用比较   总被引:3,自引:0,他引:3  
关联规则和C4.5规则能提高土地评价知识表达的可解释性和土地评价的有效性,克服传统土地评价方法中人为因素多的缺点。为对比关联规则和C4.5规则在应用中的差异,文章基于广东省土地评价数据库,在相同实验条件下进行了关联规则和C4.5规则的挖掘,并结合模糊判决算法分别建立了基于这2种分类规则的模糊分类器进行测试。结果表明,2种算法各有优缺点。其中关联规则具有更好的可支持排序标准、更客观的冗余规则去除算法以及更高的准确率;但其对数据属性要求比较高,挖掘速度也远不如C4.5规则;C4.5规则准确率略低,但其计算成本低、速度快。  相似文献   

8.
针对传统Apriori算法在生成频繁项目集时出现的瓶颈问题以及难以对非精确的或者模糊的概念进行挖掘的不足,给出了一种高效的关联规则挖掘算法。算法首先利用模糊集知识对数据库中的数值属性进行了合理的非精确语义转换,然后通过高效剪枝的挖掘方法对频繁项集进行挖掘,并将其应用到农业气象数据库的灾害分析中。试验结果表明,该算法在时间性能上有很大的提高。  相似文献   

9.
李亭  杨敬锋  陈志民 《安徽农业科学》2010,38(13):7145-7147
关联规则和C4.5规则能提高土地评价知识表达的可解释性和土地评价的有效性,克服传统土地评价方法中人为因素多的缺点。为对比关联规则和C4.5规则在应用中的差异,文章基于广东省土地评价数据库,在相同实验条件下进行了关联规则和C4.5规则的挖掘,并结合模糊判决算法分别建立了基于这2种分类规则的模糊分类器进行测试。结果表明,2种算法各有优点。其中关联规则具有更高的准确率,但其计算过程复杂,耗费时间长;C4.5规则准确率略低,但其计算成本低、速度快。  相似文献   

10.
由于大数据具有多样性的特点,在数据挖掘过程中采用单一最小支持度会出现较多冗余规则,造成挖掘效率不高等问题,该文提出一种基于多最小支持度关联规则改进算法.通过给每一项目设置单独的支持度阈值,构建多最小支持度模式树,利用最小频繁项目作为节点筛选标准,进行冗余节点删除;在挖掘频繁项集的过程中利用排序向下闭合的性质,删除冗余的候选项集,同时能够自动停止向下挖掘,从而快速直接地得到所有频繁项集,并且不需要多次扫描数据库.实验结果表明,改进算法能够提高挖掘效率,节省计算时间.  相似文献   

11.
本文将数据挖掘应用到学生成绩分析中,通过用户给定的最小支持度,利用Apriori算法得出频繁项集,结合最小置信度,确定各门课程之间的联系,以达到有针对性地帮助学生顺利完成学业的目的.  相似文献   

12.
针对用户个性差异向用户推荐适合于他们的内容已经成为Web技术的研究热点。Web挖掘是实现Web个性化推荐的关键技术之一。结合Web使用挖掘与Web内容挖掘技术,研究了网页的特征化表示和用户兴趣模型的表示,提出了一种基于Web挖掘的推荐算法,能够有效发现用户兴趣,提高推荐页面的准确率。  相似文献   

13.
针对现阶段对已出现森林虫害数据未能完成全面、及时地统计,以及难以准确预测森林虫害爆发的潜在外来诱因的问题,提出使用面向Web挖掘的主题网络爬虫搜集病虫害相关数据,并利用大数据挖掘频繁模式与关联规则的Apriori算法,挖掘结果得到满足最小支持度阈值的频繁2项集,并进一步从中筛选2种重要的特征子集,包括害虫与寄主之间的频繁模式,寄主与外来树种之间的频繁模式。解决了已出现的病虫害数据难以统计的难题;同时预测出针对某一地区害虫可能诱发森林虫害的外来树种。结果表明该方法能达到可靠、有效的森林虫害预测目的。  相似文献   

14.
随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种基于格的快速频繁项集挖掘算法LFP-growth,算法利用等价关系将原来的搜索空间(格)划分成若干个较小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子格的并集进行的约束频繁项集挖掘.实验结果和理论分析表明,在挖掘大型数据库时,LFP-growth算法的时间和空间性能均优于FP-growth算法.  相似文献   

15.
Chopper: Efficient Algorithm for Tree Mining   总被引:1,自引:0,他引:1  
With the development of Internet, frequent pattern mining has been extended to more complex patterns like tree mining and graph mining. Such applications arise in complex domains like bioinformatics, web mining, etc. In this paper, we present a novel algorithm, named Chopper, to discover frequent subtrees from ordered labeled trees. An extensive performance study shows that the newly developed algorithm outperforms TreeMinerV, one of the fastest methods proposed previously, in mining large databases. At the end of this paper, the potential improvement of Chopper is mentioned.  相似文献   

16.
陈霞  陈桂芬 《安徽农业科学》2012,40(17):9542-9545
在研究可视化与空间数据挖掘关系的基础上,探讨了可视化在时空数据挖掘过程中的应用。利用可视化表现形式使历年来测量到的玉米产量数据和精准施肥数据充分地结合在一起,同时使人们更加直观、清晰地比较和分析玉米产量和精准施肥二者之间的关系。系统地分析精准施肥对玉米产量的影响,展现了多年来精准施肥的成果,作到修正现有的精准施肥策略、指导来年的精准施肥策略,从而使得玉米增产并且更加精准地预测玉米产量。  相似文献   

17.
将免疫算法、混沌与遗传算法相结合,提出了一种新颖的混沌免疫遗传算法,该方法利用混沌运动的遍历性、随机性来产生初始种群,加快搜索的速度;利用免疫原理的浓度计算及调整加入新的混沌序列来补充种群,增加种群的多样性避免陷入局部最优;交叉变异结束后在最优解附近再用混沌进行局部寻优提高解的精度。实验结果表明,所提出的算法能寻找到更好的优化结果,并且在搜索速度上明显优于遗传和免疫遗传算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号