apriori如何实现apriori算法

apriori  时间:2021-06-22  阅读:()

Clementine关联规则Apriori算法事务模式怎么使用

算法: Apriori算法,使用逐层迭代找出频繁项集。

输入:事务数据库D;最小支持度阈值min_sup。

输出:D 中的频繁项集L。

1) L1 = find_frequent_1_itemsets(D); 2) for (k = 2; Lk-1 ≠ ; k++) { 3) Ck = aproiri_gen(Lk-1,min_sup); 4) for each transaction t D{ //scan D for count 5) Ct = subset(Ck,t); //get subsets of t that are candidates 6) for each candidate c Ct 7) c.count++; 8) } 9) Lk={c Ck | c.count ≥ min_sup} 10) } 11) return L = ∪kLk;

问读音:null,Apriori,FP-Growth的读法

汉语标出可真不准确,不方便啊 servlet /s?:vlit/--/se wu li te/ HTML 就是一个一个字母的读,它是hyper text markup language简写 null /n?l/--/na ou/ apriori 英文发音为:/?pri?ri/--/e pe rui ao rui/ FP-Growth 英文发音为:/aif pi: gr?uθ/--/F P-ge rou si/ 前面一个词一般读中文 普瑞奥瑞 后面的一个词 直接读英文

如何实现apriori算法

import?java.util.HashMap; import?java.util.HashSet; import?java.util.Iterator; import?java.util.Map; import?java.util.Set; import?java.util.TreeMap; /** *?<B>关联规则挖掘:Apriori算法</B> *? *?<P>按照Apriori算法的基本思想来实现 *? *?@author?king *?@since?2013/06/27 *? */ public?class?Apriori?{ private?Map<Integer,?Set<String>>?txDatabase;?//?事务数据库 private?Float?minSup;?//?最小支持度 private?Float?minConf;?//?最小置信度 private?Integer?txDatabaseCount;?//?事务数据库中的事务数 private?Map<Integer,?Set<Set<String>>>?freqItemSet;?//?频繁项集集合 private?Map<Set<String>,?Set<Set<String>>>?assiciationRules;?//?频繁关联规则集合 public?Apriori( ????Map<Integer,?Set<String>>?txDatabase,? ????Float?minSup,? ????Float?minConf)?{ ???this.txDatabase?=?txDatabase; ???this.minSup?=?minSup; ???this.minConf?=?minConf; ???this.txDatabaseCount?=?this.txDatabase.size(); ???freqItemSet?=?new?TreeMap<Integer,?Set<Set<String>>>(); ???assiciationRules?=?new?HashMap<Set<String>,?Set<Set<String>>>(); } /** *?扫描事务数据库,计算频繁1-项集 *?@return */ public?Map<Set<String>,?Float>?getFreq1ItemSet()?{ ???Map<Set<String>,?Float>?freq1ItemSetMap?=?new?HashMap<Set<String>,?Float>(); ???Map<Set<String>,?Integer>?candFreq1ItemSet?=?this.getCandFreq1ItemSet(); ???Iterator<Map.Entry<Set<String>,?Integer>>?it?=?candFreq1ItemSet.entrySet().iterator(); ???while(it.hasNext())?{ ????Map.Entry<Set<String>,?Integer>?entry?=?it.next(); ????//?计算支持度 ????Float?supported?=?new?Float(entry.getValue().toString())/new?Float(txDatabaseCount); ????if(supported>=minSup)?{ ?????freq1ItemSetMap.put(entry.getKey(),?supported); ????} ???} ???return?freq1ItemSetMap; } /** *?计算候选频繁1-项集 *?@return */ public?Map<Set<String>,?Integer>?getCandFreq1ItemSet()?{ ???Map<Set<String>,?Integer>?candFreq1ItemSetMap?=?new?HashMap<Set<String>,?Integer>(); ???Iterator<Map.Entry<Integer,?Set<String>>>?it?=?txDatabase.entrySet().iterator(); ???//?统计支持数,生成候选频繁1-项集 ???while(it.hasNext())?{ ????Map.Entry<Integer,?Set<String>>?entry?=?it.next(); ????Set<String>?itemSet?=?entry.getValue(); ????for(String?item?:?itemSet)?{ ?????Set<String>?key?=?new?HashSet<String>(); ?????key.add(item.trim()); ?????if(!candFreq1ItemSetMap.containsKey(key))?{ ??????Integer?value?=?1; ??????candFreq1ItemSetMap.put(key,?value); ?????} ?????else?{ ??????Integer?value?=?1+candFreq1ItemSetMap.get(key); ??????candFreq1ItemSetMap.put(key,?value); ?????} ????} ???} ???return?candFreq1ItemSetMap; } /** *?根据频繁(k-1)-项集计算候选频繁k-项集 *? *?@param?m?其中m=k-1 *?@param?freqMItemSet?频繁(k-1)-项集 *?@return */ public?Set<Set<String>>?aprioriGen(int?m,?Set<Set<String>>?freqMItemSet)?{ ???Set<Set<String>>?candFreqKItemSet?=?new?HashSet<Set<String>>(); ???Iterator<Set<String>>?it?=?freqMItemSet.iterator(); ???Set<String>?originalItemSet?=?null; ???while(it.hasNext())?{ ????originalItemSet?=?it.next(); ????Iterator<Set<String>>?itr?=?this.getIterator(originalItemSet,?freqMItemSet); ????while(itr.hasNext())?{ ?????Set<String>?identicalSet?=?new?HashSet<String>();?//?两个项集相同元素的集合(集合的交运算)???? ?????identicalSet.addAll(originalItemSet);? ?????Set<String>?set?=?itr.next();? ?????identicalSet.retainAll(set);?//?identicalSet中剩下的元素是identicalSet与set集合中公有的元素 ?????if(identicalSet.size()?==?m-1)?{?//?(k-1)-项集中k-2个相同 ??????Set<String>?differentSet?=?new?HashSet<String>();?//?两个项集不同元素的集合(集合的差运算) ??????differentSet.addAll(originalItemSet); ??????differentSet.removeAll(set);?//?因为有k-2个相同,则differentSet中一定剩下一个元素,即differentSet大小为1 ??????differentSet.addAll(set);?//?构造候选k-项集的一个元素(set大小为k-1,differentSet大小为k) ??????if(!this.has_infrequent_subset(differentSet,?freqMItemSet)) ??????????candFreqKItemSet.add(differentSet);?//?加入候选k-项集集合 ?????} ????} ???} ???return?candFreqKItemSet; } /** ?*?使用先验知识,剪枝。

若候选k项集中存在k-1项子集不是频繁k-1项集,则删除该候选k项集 ?*?@param?candKItemSet ?*?@param?freqMItemSet ?*?@return ?*/ private?boolean?has_infrequent_subset(Set<String>?candKItemSet,?Set<Set<String>>?freqMItemSet)?{ Set<String>?tempSet?=?new?HashSet<String>(); tempSet.addAll(candKItemSet); Iterator<String>?itItem?=?candKItemSet.iterator(); while(itItem.hasNext())?{ String?item?=?itItem.next(); tempSet.remove(item);//?该候选去掉一项后变为k-1项集 if(!freqMItemSet.contains(tempSet))//?判断k-1项集是否是频繁项集 return?true; tempSet.add(item);//?恢复 } return?false; } /** *?根据一个频繁k-项集的元素(集合),获取到频繁k-项集的从该元素开始的迭代器实例 *?@param?itemSet *?@param?freqKItemSet?频繁k-项集 *?@return */ private?Iterator<Set<String>>?getIterator(Set<String>?itemSet,?Set<Set<String>>?freqKItemSet)?{ ???Iterator<Set<String>>?it?=?freqKItemSet.iterator(); ???while(it.hasNext())?{ ????if(itemSet.equals(it.next()))?{ ?????break; ????} ???} ???return?it; } /** *?根据频繁(k-1)-项集,调用aprioriGen方法,计算频繁k-项集 *? *?@param?k? *?@param?freqMItemSet?频繁(k-1)-项集 *?@return */ public?Map<Set<String>,?Float>?getFreqKItemSet(int?k,?Set<Set<String>>?freqMItemSet)?{ ???Map<Set<String>,?Integer>?candFreqKItemSetMap?=?new?HashMap<Set<String>,?Integer>(); ???//?调用aprioriGen方法,得到候选频繁k-项集 ???Set<Set<String>>?candFreqKItemSet?=?this.aprioriGen(k-1,?freqMItemSet); ???//?扫描事务数据库 ???Iterator<Map.Entry<Integer,?Set<String>>>?it?=?txDatabase.entrySet().iterator(); ???//?统计支持数 ???while(it.hasNext())?{ ????Map.Entry<Integer,?Set<String>>?entry?=?it.next(); ????Iterator<Set<String>>?kit?=?candFreqKItemSet.iterator(); ????while(kit.hasNext())?{ ?????Set<String>?kSet?=?kit.next(); ?????Set<String>?set?=?new?HashSet<String>(); ?????set.addAll(kSet); ?????set.removeAll(entry.getValue());?//?候选频繁k-项集与事务数据库中元素做差运算 ?????if(set.isEmpty())?{?//?如果拷贝set为空,支持数加1 ??????if(candFreqKItemSetMap.get(kSet)?==?null)?{ ???????Integer?value?=?1; ???????candFreqKItemSetMap.put(kSet,?value); ??????} ??????else?{ ???????Integer?value?=?1+candFreqKItemSetMap.get(kSet); ???????candFreqKItemSetMap.put(kSet,?value); ??????} ?????} ????} ???}

无忧云:服务器100G高防云服务器,bgpBGP云,洛阳BGP云服务器2核2G仅38.4元/月起

无忧云怎么样?无忧云值不值得购买?无忧云,无忧云是一家成立于2017年的老牌商家旗下的服务器销售品牌,现由深圳市云上无忧网络科技有限公司运营,是正规持证IDC/ISP/IRCS商家,主要销售国内、中国香港、国外服务器产品,线路有腾讯云国外线路、自营香港CN2线路等,都是中国大陆直连线路,非常适合免备案建站业务需求和各种负载较高的项目,同时国内服务器也有多个BGP以及高防节点。目前,四川雅安机房,4...

无忧云:洛阳BGP云服务器低至38.4元/月起;雅安高防云服务器/高防物理机优惠

无忧云怎么样?无忧云,无忧云是一家成立于2017年的老牌商家旗下的服务器销售品牌,现由深圳市云上无忧网络科技有限公司运营,是正规持证IDC/ISP/IRCS商家,主要销售国内、中国香港、国外服务器产品,线路有腾讯云国外线路、自营香港CN2线路等,都是中国大陆直连线路,非常适合免备案建站业务需求和各种负载较高的项目,同时国内服务器也有多个BGP以及高防节点。一、无忧云官网点击此处进入无忧云官方网站二...

IMIDC(rainbow cloud):香港/台湾/日本/莫斯科独立服务器特价,闪购大促销,最低30usd/月起

imidc怎么样?imidc彩虹网路,rainbow cloud知名服务器提供商。自营多地区数据中心,是 Apnic RIPE Afrinic Arin 认证服务商。拥有丰富的网路资源。 在2021年 6.18 开启了输血大促销,促销区域包括 香港 台湾 日本 莫斯科 等地促销机型为 E3係,参与促销地区有 香港 日本 台湾 莫斯科 等地, 限量50台,售罄为止,先到先得。所有服务器配置 CPU ...

apriori为你推荐
ae序列号ae序列号存储区域网络网络存储技术的SAN(存储区域网络)的优点爱短信官网官方飞信,ET飞信,爱短信飞信插件哪个好用??暴力破解rar对RAR压缩包进行解压时需要密码,使用暴力破解仍无法解码该怎么办?举报非法网站如何举报非法网站?netbios协议NetBIOS协议起什么作用?腾讯合作伙伴大会从微信同程旅行买的机票怎么打印电子发票?防火墙技术应用常用防火墙技术有哪几种微盟价格微盟怎么收费?aviconverter跪求AVIConverter V1.0下载地址
bandwagonhost 韩国加速器 外国空间 三拼域名 个人空间申请 52测评网 北京双线 服务器合租 hdd 免费网页申请 如何注册阿里云邮箱 带宽租赁 百度云加速 中国linux 汤博乐 .htaccess 空间排行榜 ncp是什么 pptpvpn 热云 更多