首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
关联分析是数据挖掘的本质体现,关联规则挖掘就是寻找给定的大量数据项集之间存在的某种规律的过程。Apriori算法是关联规则中最重要的一种挖掘频繁项集的算法,但是它也存在一定的不足。目的为了提高挖掘效率。方法采用实验的方法,在经典Apriori算法的基础上进行改进。结果证明改进的Apriori算法性能优于经典的Apriori算法,尤其是在交易事务条数比较多的情况下,效果更加明显。结论是改进的算法在计算支持度个数时,每次不需要扫描全部数据库,只需要在精简的数据库表中扫描各项所在的行就可以了,大大节省了时间;支持度计数的统计也比较容易,也不会产生过多的冗余,可以在很大程度上降低挖掘的复杂度,提高挖掘算法的效率。  相似文献   

2.
一种新的关联规则抽样算法   总被引:1,自引:0,他引:1  
针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。  相似文献   

3.
关联规则挖掘在课程相关分析中的应用   总被引:1,自引:0,他引:1  
本研究介绍了关联规则挖掘的基本概念,分析了经典的Apriori算法,提出一种改进的关联规则挖掘算法,解决了挖掘课程相关性关联规则的问题。改进算法的基本思想:①采用位图数据格式;②系统中会永久保留支持度为0的候选1项集和候选2项集,当系统需要运行时,首先采用数据库的过滤技术,可以很快得到频繁2项集。突破了这一瓶颈,系统运行速度将得到较大的提升。将该算法应用于课程相关性分析,实验结果表明改进的算法性能优于Apriori算法。  相似文献   

4.
关联规则挖掘技术是一种新兴的数据处理技术,其算法及应用在图书馆中起着非常重要的作用。Apriori算法是关联规则挖掘的经典算法,在分析Apriori算法的基础上,提出利用FP-tree生成树技术来减少候选集的数量,克服Apriori算法的弱点,以提高图书馆个性化服务的效率。  相似文献   

5.
时态数据库周期规律与关联规则的挖掘   总被引:6,自引:0,他引:6  
提出了一种简单有效、抗干扰的周期规律挖掘算法;研究了关联规则提取过程中的连续属性离散化,并用Apriori算法发现有效的规则。对电信话务量时态数据库的挖掘测试结果表明,该算法实现较简单,执行效率较高,具有实用性和有效性。  相似文献   

6.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。  相似文献   

7.
数据挖掘中的关联规则应用广泛,而频繁项集的产生又是关联规则挖掘最重要的一步。讨论了关系数据库中利用Apriori算法实现频繁项集挖掘的问题,并借助AprioriTid算法思想,提出了一种改进的基于SOL的频繁项集挖掘算法。试验证明,在事务数据量和支持度变化的情况下,此算法性能稳定且执行效率较好。  相似文献   

8.
针对传统Apriori算法在生成频繁项目集时出现的瓶颈问题以及难以对非精确的或者模糊的概念进行挖掘的不足,给出了一种高效的关联规则挖掘算法。算法首先利用模糊集知识对数据库中的数值属性进行了合理的非精确语义转换,然后通过高效剪枝的挖掘方法对频繁项集进行挖掘,并将其应用到农业气象数据库的灾害分析中。试验结果表明,该算法在时间性能上有很大的提高。  相似文献   

9.
本文以笔者所在院校的学生数据为依据,对教学质量评价系统中的数据进行挖掘,分析了关联规则算法中Apriori算法,并针对传统算法的弊端,在已有改进算法的基础上,提出了一种基于最小关联规则集的改进算法,以此方法对教师的基本信息、教学方法与教学评估结果的关联关系进行分析。  相似文献   

10.
在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,将传统事务数据转换成二进制数,然后用数字的递增和递减两种方式双向搜索候选频繁项;算法通过序列数的度来计算支持数,实现一次扫描数据库,有效地提高了算法的效率.  相似文献   

11.
在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,将传统事务数据转换成二进制数,然后用数字的递增和递减两种方式双向搜索候选频繁项;算法通过序列数的度来计算支持数,实现一次扫描数据库,有效地提高了算法的效率.  相似文献   

12.
关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。  相似文献   

13.
为了识别用户浏览模式,实现利用关联规则挖掘算法Apriori对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行挖掘的模块,该模块针对用户选定的若干页面产生满足最小支持度和最小置信度的页面之间的强关联规则。关联规则挖掘结果对网站管理员重新调整网站结构、通过预测用户浏览模式提供推送服务来提高用户的访问效率和网站资源的利用率有一定的指导作用。  相似文献   

14.
近年来,关系数据库得到了广泛的应用,研究在关系数据库中进行关联规则挖掘的有效技术的需求日益增强。文中根据Apriori算法思想并在分析关系数据库中关联规则特点的基础上,介绍了基于Visual FoxPro的关联规则挖掘的实现过程。  相似文献   

15.
数字化图书馆中包含数目庞大的藏书,其包含的数据量也是非常巨大的,如何有效地利用数字图书馆中的资源,增强图书馆的服务体验是一项急需解决的问题.分析了数据挖掘算法中的关联规则算法,并对数据挖掘中的Apriori算法进行了矩阵挖掘技术改进.  相似文献   

16.
FP-Growth算法的效率约比Apriori快一个数量级,但存在FP-tree可能过大和串行处理等两大缺点,为此提出了基于局部FP-tree的并行关联规则挖掘算法P-FP-Growth。为实现基于云计算的并行关联规则挖掘,用MapReduce计算模型描述了P-FP-Growth算法,在Hadoop下进行了编程实现,得出了频繁模式挖掘结果,验证了该算法在云计算平台进行部署和执行的可行性。对比了算法分别在局域网多节点并行处理和在Hadoop平台执行的所需时间。  相似文献   

17.
频繁项集挖掘是关联规则挖掘的核心部分,目前大多数关于关联规则挖掘的研究都集中于如何提高频繁项集挖掘的效率,然而在实际应用中,决策者面对的是最终从频繁项集中生成的规则集,因此优化规则的生成过程及生成规则同样值得重视。本文提出频繁项集的子集树这一模式来生成关联规则,不仅简化规则的生成过程还可缩小决策者面对的规则集,更便于规则的增量更新。  相似文献   

18.
分析研究关联规则挖掘经典算法Apriori和FP-Growth算法,发现其不足之处在于构建和遍历各自数据结构的时间长、内存消耗巨大,降低了算法在时间和空间方面的效率.针对2种算法的缺陷,提出了LK-Growth算法,该算法不再构建FP-Tree,而是构建单向线性链表组结构,能有效地缩短发现频繁模式的时间和节省内存空间开支.研究结果表明,LK-Growth算法的实用性强且挖掘效率更高.  相似文献   

19.
探讨了空间关联规则,利用移动计算中基于Apriori算法的空间关联规则提取的例子,详细介绍了经典算法Apriori算法在空间关联规则中的应用,并对空间数据挖掘的发展进行了展望。  相似文献   

20.
在油气长输管道完整性管理领域引入数据挖掘中的关联规则技术,发现完整性数据中潜在的关联关系,充分发挥数据价值。通过对管道完整性数据关联规则挖掘流程进行研究,对经典Apriori算法中频繁项集生成效率进行优化,结合中国石油某管道开展完整性管理积累的外检测与内检测数据进行了关联规则挖掘,并对挖掘结果进行分析和解释。挖掘结果表明:通过关联规则技术可以发现管道本体缺陷与周边环境、本体属性数据之间潜在的关联关系。关联规则挖掘方法应用于管道完整性数据分析能够有效减少无兴趣规则的数量,发现潜在的管理重点,为长输管道完整性管理提供科学、准确的决策依据。(表1,参10)  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号