加入收藏 | 设为首页 | 关于我们 尊敬的先生/女士,您好,欢迎光临论文世界网!

 联系我们

点击这里给我发消息 点击这里给我发消息
联系电话:158-6676-5171
 免费论文
基于博弈的正负加权关联规则的研究5
发布时间:2018-11-07 点击: 发布:中国论文期刊网
 本章算法在对数据项集进行连接和剪枝时引用了Apriori算法的性质l,同时提出了
一个定理,具体如下:
    性质1向下封闭性:频繁项集A的任何非空子集都是频繁的,非频繁项集A的任
意超集是非频繁的
    定理1在基于向量的概率加权关联规则挖掘算法中,假设正准备挖掘频繁K项集,
在扫描事务向量集的过程中,若事务向量的长度小于K,则该事务中的项目属性不参与
挖掘频繁项集。
    证明:给定一个事务T,其长度为TI,而事务T的任意K (}T}<K<一}刀)项子集元素相“与”的结果都为0,不影响K项子集的加权支持度,所以在正准备挖掘频繁K项集时,若事务向量的长度小于K,则该事务中的数据项不参与挖掘频繁项集,证毕。
    为了减少候选项集的产生,提高挖掘效率,在产生候选K项集之前,先排除事务向量长度(1的个数)小于K的事务向量,如果小于K,将其置为零向量,否则通过向量元素之间的逻辑“与”操作,根据定义2及定义3计算加权支持度以产生满足最小加权支持度的频繁项集,将频繁项目集中的项目属性存入集合F中,其它项目属性存入集合NF,中,再根据集合NF,将事务向量中相应的位置0,重复迭代此过程直至所有事务向量都为零向量。
 

3.4改进的加权关联规则算法描述

    从以上算法的分析来看,提高算法效率的关键在于以下几点:
    1.项目权值的设定
    项目的权值设定可以根据具体的应用实例特征而定,其取值直接影响挖掘结果。如
    2.项集权值的设定
采用的足New-Apriori算法中权值的计算方法:w(x)=max(w1,w2,w3…wn).
设i={i1,i2,…in}是项目集合,又寸应的权值集是w={w1,w2,w3…wn},j=1,2…n, D是山事务T组成的事务数据库,数据库中事务总数记为m。设项集X={i1,i2,…in},其支持数记为CT(X), Y类似。最小支持度和最小置信度符号仍然是wmin_ sup和wmin_ confo这种模型有以下优势:能够在很大程度_L反映项集的重要性,关注了大权值的项目;不会使得加权支持度大于1;在一定的约束条件下能够保留频繁集的向下封闭性,可以利用此性质及派生性质进行高效剪枝;向下封闭性保证由连接频繁(k-1)一项集形成频繁k一项集的正确性,不会漏掉频繁项集。
3.加权支持度一置信度模型选择
支持度为wsup(x)=w(x)*sup(x)
其中,suo(x)=CT(x)/m,CT(x)是事务数据库中包含项集X的记录个数
X-Y的关联置信度:
    项集权值的设定方法和加权支持度模型,使得该算法在做出以下的预处理后保留频繁项集的向下封闭性:参考文献〔11],将项集I中的各项按照权值降序排列,将排序后的各项分别对应于中各项。做此设置的目的有两个:一是为了适应人们的思维习惯,使得下标小的项目在前而且下标有序;一是为了简化项b的表达形式。设项集X中各项的下标表示为X(i),若X(P)<X(q),则有

QQ在线编辑

  • 在线咨询
  • 点击这里给我发消息
    客服小薇
  • 点击这里给我发消息
    晚班客服
  • 点击这里给我发消息
    客服小爱
  • 点击这里给我发消息

服务热线

  • 158-6676-5171
展开