加入收藏 | 设为首页 | 关于我们 尊敬的先生/女士,您好,欢迎光临论文世界网!

 联系我们

点击这里给我发消息 点击这里给我发消息
联系电话:158-6676-5171
 免费论文
基于博弈的正负加权关联规则的研究2
发布时间:2018-11-07 点击: 发布:中国论文期刊网
  这种以项目权值作为集合权值的算法采用类似Apriori算法的思想进行连接和搜索有诸多缺陷。一是先验原理不再成立,所以在生成FK的过程中,不能保证FK-1与自己连接得到的CK,同时满足LK∈cK。二是New-Apriori算法需要重复扫描数据库以进行计数,由于修剪性质的无效,会产生远多于对于Apriori算法的候选项集,且项集维度越高,候选项集呈指数增加。由此可见,由于两个缺陷,算法性能明显降低。
 

  3.1.2混合健全关联规则

把数据库按交易的时间分成个间隔为第个交易时间间隔段的左端点,为相应时间间隔段的右端点。每一个交易时间间隔段都设置了相应的权重。如果数据库中的某一项集的交易时间在我们分的间隔端之间,即落在和之间,那我们就说项集,在区间内有垂直权重,计算公式为
Supp(x)表示项集的垂直加权支持度。vi表示第个交易时间的垂直权重,count(Xi)表示x在对应vI的时间段中包含的交易计数,对的计算公式为表示的是加入权重后的总事务数,Ni表示的是中的总事务数。在上两节中,我们了解了常见的水平加权算法的基本思想,同样,我们也可以引入一种基于项平均权值的水平加权关联规则定义如下:对于给定的项集,每一个项目设置一个水平的权值其中。定义水平加权支持度wsup(x)

3.2改进的加权关联规则

  3.2.1改进算法的基本概念和理论

    给定事务数据库T}其项目的集合为I ={11,IZ,...,In},每一条事务t都对应I的一个子集,并赋予一个事务标识符TID。集合I=毛1}, I2 ,. ., In}中的所有项目弓均被赋以权值w},来表示项目的重要性,其中0<_w} S1}  j={1,2,...,n}。根据每个数据项的权值,确定每一条事务记录的权重。
定义4.1:事务t的权重记为w(t)
W (t,一1t1 }Wiet(4.1)其中,定义4}tl表示事务t中包含的项目的个数。
.2:项目集X是I的子集,其加权支持度为:
                    
(4.2)
    即:所有包含项目集X的事务的权重之和与事务数据库T中所有的交易的权重之和的比。
定义4.3:对定义2进行扩展后,可知项集XUY的加权支持度为:
即:所有包含项目集XUY的事务的权值之和与事务数据库T中所有的交易的权值之和的比。

QQ在线编辑

  • 在线咨询
  • 点击这里给我发消息
    客服小薇
  • 点击这里给我发消息
    晚班客服
  • 点击这里给我发消息
    客服小爱
  • 点击这里给我发消息

服务热线

  • 158-6676-5171
展开