加入收藏 | 设为首页 | 关于我们 尊敬的先生/女士,您好,欢迎光临论文世界网!

 联系我们

点击这里给我发消息 点击这里给我发消息
联系电话:158-6676-5171
 免费论文
基于博弈的正负加权关联规则的研究1
发布时间:2018-11-07 点击: 发布:中国论文期刊网

3.加权关联规则模型

以Apriori, PF-growth等为代表的常见的关联规则挖掘算法,都是以数据库中各项目的重要程度相同以及各项目分布均为前提。但在现实生活中,这些前提往往无法满足。这就导致在挖掘过程中,对支持度闽值的设定十分困难,如果最小支持度设置偏高,会出现过多冗余无效的规则,如设置偏低,一些重要的人们感兴趣的规则往往被隐藏起来。关联规则是表示数据库中一组对象之间某种关联关系的规则,事务数据库是关联规则挖掘的主要对象。关联规则挖掘是数据挖掘技术中的一个重要研究领域,而关联规则挖掘的主要过程是频繁项集的生成。将现有的频繁项集生成算法应用于数据处理可以方便的进行。
为此,提出了为项目添加权重的策略,将权重引入到频繁模式的挖掘中,以解决上述所说的项目重要性程度不同等问题,从而使挖掘出来的关联规则更符合需要也更有现实价值。由此引入的加权关联规则,涉及到三个问题:权值的设定方法、权值的分配过程、高效的算法。研究者从多个角度出发,提出了一些加权关联规则挖掘算法,并尝试进行了改进和优化,取得了一定成果。
 

3.1加权关联规则的算法模型

  3.1.1水平加权关联规则

经典的加权关联规则基本概念为:设D为事务数据库,据库中的全部项集,对应I的权重集为H={h1,,h2...,hn}要程度,其中h1表示项目I1的重要程度,且0≤hj≤1,i={i1,i2,…in}。X⊆I
Y⊆I,且X∩Y=∅记sup(X),conf(X)分别为X的支持度和可信度,minsup和minconf为最小支持度与最小置信度,加权支持度阈值用wminsup表示,加权可信度阈值用wminconf表示。
项目集i={i1,i2,…in}将Ij中所有项目组都赋予与自身权重相当的权值hj,0<hj<1}  j ={1,2,...,n}。将I中所有项目按权值从大到小排列,使使I中的所有项目按顺序组成一个完整的序列数据集。用x<y表示项目X排在项目Y之前(即指定集合Y的权值小于指定集合X的权值。i的任何一个集合X中的项目均参照项目集合中的整体序列排列,合集X的第i个项目用X (i)表示。
基于Apriori算法先验原理,在水平加权关联规则挖掘中都不在成立。
    根据上述性质,结合Apriori算法,张智军等人给出了水平加权支持度的定义,提出了名为New-Apriori水平加权关联规则算法,其中项目集X的加权支持度定义为:wsup(X) = max {h1,h2,...,hk下sup(X),其中h}为项目i}的权值。
    New-Apriori算法分两步实现:首先找出所有加权支持度不小于用户指定的最小加权支持度~insup约束的所有加权频繁项集,记为L,然后利用加权频繁项集产生满足最小加权可信度wminconf约束的所有加权关联规则。在生成L、过程中,仍使用逐层搜索的迭代方法,首先由Lx_,与自己连接生成Cx,然后剔除Cx中非频繁项集,得到Lx。因为水平加权支持度的定义使Apriori的两条基木性质不能成立,所以剪枝的依据发生了改变,只能由唯一的水平加权支持度标准来衡量。由性质3.1,如果项目集X是加权频繁的,则X支持度sup(X) >_ wminsup,因此,频繁项集是加权频繁项集的超集。New-却riori算法就是根据这个特性产生的。

QQ在线编辑

  • 在线咨询
  • 点击这里给我发消息
    客服小薇
  • 点击这里给我发消息
    晚班客服
  • 点击这里给我发消息
    客服小爱
  • 点击这里给我发消息

服务热线

  • 158-6676-5171
展开