频繁项集与关联规则Frequent Itemset Mining and Association Rules、A-Priori算法 , PCY算法

本文介绍了频繁项集和关联规则的概念,如支持度和置信度,并探讨了A-Priori算法及其工作原理,通过减少内存和时间消耗寻找频繁项集。此外,还提及了PCY算法,该算法利用散列技术优化了寻找频繁二项集的过程,特别适用于处理大量数据。

目标:寻找大量客户通常共同购买的项目
方法:使用收集的销售数据寻找频繁项集

频繁项集 Frequent Itemset

一个经典规则:如果有人买尿布和牛奶,那么他/她很可能买啤酒!
购物篮模型:描述两类对象的多对多关系。
:商场中的不同商品
购物篮:每个顾客购买的商品总和
在这里插入图片描述

支持度support:指包含项集I的购物篮个数
通常我们会设置一个阈值S(support threshold)。如果项集I的支持度(I的子集)≥ S,那么I是频繁项集
在这里插入图片描述
在这里插入图片描述

关联规则 Association Rules

在这里插入图片描述
可信度/置信度 confidence

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值