加入收藏 | 设为首页 | 关于我们 尊敬的先生/女士,您好,欢迎光临论文世界网!

 联系我们

点击这里给我发消息 点击这里给我发消息
联系电话:158-6676-5171
 免费论文
基于博弈的正负加权关联规则的研究9
发布时间:2018-11-07 点击: 发布:中国论文期刊网
5.划分等价类
根据项集前缀不同,将频繁2项集L2划分成以B开头和以O开头的等价类,将事务矩阵Dz分成两个矩阵Doz和DBz,压缩矩阵,删除冗余列后,得到更新的矩阵Do2,和DB2',同时生成新的事务权重向量w和计数数组m.
在以O开头的子集To= {OM,OC}中,新的权重向量更新为W0=[0.5,0.633,0.5,0.633,0.575],计数数组mo={2,2,2,2,2},不用进行列压缩,因此二者的并集是一个候选3项集{OMC} .OMC的
2项子集都是频繁的,因此保留此候选3项频集。因为OM n OC=11111所以项集OMC的加权支持度为wsup {OMC}一(0.5 X 1+0.633X 1+ 0.5 X 1+0.633 X 1+0.575 X 1)/Wo =0.736>MIS(OMC)=MIS}O)=0.6,故{OMC}是3项频集。此时{OMC}=1该部分算法终止,以O开头的等价类挖掘完毕。

挖掘以B开头的等价类集。在以B开头的子集TB= (BA,BO,BM,BC)中,新的权重向量更新为%一[0.467,0.575],计数数组更新为mB ={2,3 },更新的矩阵为Db2
由于Db2对应的计数数组ms中的值均大于1,因此无需压缩,按照内部拼接的方法组成初步的候选3项集{BAO, BAM, BAC, BOM, BOC, BMC),对于候选{BAO},尽管其2项子集AO是非频繁的,但是MIS(B) }MIS(A),故依然将其保留在候选3项集中。因为TID ( BAO)一。,故{BAO}是非频繁的。To中相同的方法,可得到BAC, BOM, BOC, BMC都是3项频集,L3={BAC, BOM, BOC, BMC,OMC},同时生成新的矩阵DB3、权重数组%和计数数组mB.
此时,[BAC, BOM, BOC, BMC] > 1算法继续,因为mB有等于1的值,压缩矩阵,得到新的DB3,更新权重数组和计数数组。扫描DB3,按照拼接方法由BOMBOC二者合并生成候选4项集{BOMC},由于其3项子集都是频繁的,不枝剪。使用新的权重向量we =[0.575],按照内积运算公式求得的BOMC的加权支持度wsup(BOMC)=0.575/We=0.148>MIS(B)=0.1,故{BOMC}是频繁4项集。生成新的DB4.WB和mB。此时,mB=[1],该部分算法终止。
6.合并所有等价类中的频繁项集,得到全局的频繁项集L={B, O, M,C, BA, BO, BM, BC, OM, OC, MC, BAC, BOM, BOC, BMC, OMC, BOMC}.
从挖掘出的结果来分析,由于项目B的最小支持度较低,即使项目B的权重不高,但经过加权,挖掘出来了大量和项目B有关的加权频繁项集,可见算法能有效反映不同记录的重要性。
 

4实验结果与分析

4.1实验目的

    本实验目的是设计在单最小支持度卜对NAWARM算法和NCMA算法进行州-能测试,在多最小支持度下对NWARMSK- MMS算法与DWARMMS算法进行性能测试,将两组测试结果进行对比,分析和评价改进算法与对比算法的差异。
 

QQ在线编辑

  • 在线咨询
  • 点击这里给我发消息
    客服小薇
  • 点击这里给我发消息
    晚班客服
  • 点击这里给我发消息
    客服小爱
  • 点击这里给我发消息

服务热线

  • 158-6676-5171
展开