加入收藏 | 设为首页 | 关于我们 尊敬的先生/女士,您好,欢迎光临论文世界网!

 联系我们

点击这里给我发消息 点击这里给我发消息
联系电话:158-6676-5171
 免费论文
基于博弈的正负加权关联规则的研究4
发布时间:2018-11-07 点击: 发布:中国论文期刊网

3.3.2压缩矩阵的存储运算

    在经典算法中,每次由频繁< k-1)一项集推导出频繁k-项集时,均会扫描一次数据库,消耗了大量I/O时间,当数据量很大时,访问数据库的时间会显著增长。为了减少数据库的扫描频次,本文采用了矩阵存储结构,根据数据库事务中的数据项是否出现在项目属性集I中,则将相应位置分别置为1或0以生成事务向量,其中事务向量的长度和项目属性集I中元素个数相等,在第一次扫描事务数据库时会生成事务矩阵,之后在产生候选项集和频繁项集时只需操作该事务矩阵即可。基本定义如下:
定义4.4}41}:给定事务数据库D} I为所有项目的集合,T为所有事务的集合,则存在有

其中m为事务数,n为项目数,M的取值为

定义4.5.令I是书屋数据库D中所有项的几何,每一个想Ii的向量定义为RI=(m1,m2,…mi),实物记录权重向量定义为A=(W(t1),W(t2)…W(tn)),W(tn)为第n条事务的权重,则该项I的加权支持度为RI和A的内积与数据库总权重之比,即wsup(Ii)=RiA/∑w(t)
定义4.6{It,Ij}为2项集,则其向量表示为Rij=Ri^Rj=(m1i^m1j,m2i^m2j…mni^mnj)T
其中{Ii,Ij}的加权支持度为wsup(Ii,Ij)=RiA/∑w(t)

  3.3.3优化拼接和剪枝方法

   扫描事务数据库时,生成两个矩阵向量,包括数据项权值向量、数据库事务记录向量集,其中事务记录向量集中的每个向量都是一条只包含0和1的事务记录,数据项权值向量记录了每个数据项在事务数据库出现的概率。而连接和剪枝过程以及生成所有频繁项集都是通过该事务向量集完成。本章采用了一种新的连接和剪枝策略,相关定义如下:定义2记W(X)为项目集X的事务权值,它是事务数据库的项目集X中各项目的权值汇总,即:


其中[X]>1,ij∈X,

当[X]=1时,W(X)=W(ij)
定义3:及Fre(x)项目集在事务记录中出现频率。即
 
 
当[X]=1时,Fre(x)=W(ij)
定义4:记WS为项集X的加权支持度,即:
WS=W(x)*Fre(x)
    定义5事务向量集:事务向量是由0和1组成的向量,若事务中的数据项属于项目
集I,则将相应位置置1,否则置0。例如项集I--{ABCDEFGI},事务T={ACEGH}
则T对应的事务向量为V [1,0,1,0,1,0,1,1],记事务向量为traps vector,数据库DB中所
有事务对应的事务向量的集合称为事务向量集,记为traps vectors.
    定义6事务向量长度:事务记录中项目属性的个数或者事务向量元素为1的个数,
记作tlengtho

QQ在线编辑

  • 在线咨询
  • 点击这里给我发消息
    客服小薇
  • 点击这里给我发消息
    晚班客服
  • 点击这里给我发消息
    客服小爱
  • 点击这里给我发消息

服务热线

  • 158-6676-5171
展开