活动门店RFM分析项目
基于RFM模型+KMeans聚类的新品活动门店价值分层分析,为运营策略制定提供数据支撑
项目概述
本项目针对线下零食连锁品牌新品活动效果不佳的问题,通过RFM用户分层模型+KMeans聚类算法,完成门店价值分层,识别不同类型门店的活动参与特征与销售贡献,输出可落地的精细化运营策略,实现资源精准投放、活动效果提升的核心目标。
一、项目背景
开展新品活动后,活动效果不佳,需针对不同的门店情况,精细化运营:
- 识别高价值核心门店,保障核心资源倾斜;
- 筛选低价值门店,提高转化;
- 定位流失风险门店,制定召回策略。
二、技术栈
| 类别 | 技术/工具 |
|---|---|
| 数据处理 | Python、Pandas、NumPy |
| 可视化 | Matplotlib、Seaborn |
| 机器学习 | Scikit-learn(StandardScaler、KMeans) |
三、核心功能模块
1. 数据预处理
- 日期格式标准化转换;
- 剔除非核心字段,聚焦门店消费核心维度;
- 异常值/警告屏蔽,保证分析流程稳定。
2. RFM指标计算
基于门店消费行为计算核心指标:
- R(Recency):门店最近一次消费与活动结束日的间隔天数;
- F(Frequency):门店消费频次(活动期间消费次数);
- M(Monetary):门店消费金额/销量(活动期间总销量)。
3. RFM打分与可视化
- 基于分位数(25%/50%/75%)对R/F/M指标分段打分;
- 可视化RFM组合分数分布(彩虹渐变配色柱状图)。
肘部法则选最优k值
4. KMeans聚类分析
- 数据标准化消除量纲影响;
- 肘部法则选择最优聚类数量(k=4);
- 门店价值分层聚类,并可视化分群结果。
5. 分群特征统计
输出各聚类分群的RFM打分均值,量化不同门店群的核心特征。
四、项目亮点
- 业务贴合性:采用真实数据,聚焦业务场景,指标设计贴合行业特点;
- 数据可视化:肘部法则图、分群分布图,直观呈现分析结果;
- 算法落地性:肘部法则科学选k,避免聚类数量主观判断;
- 可解释性强:聚类结果映射为业务化分群名称(如高价值核心门店),便于运营理解。
五、分析结果与业务建议
Cluster 1:核心高价值标杆门店
特征拆解(全维度得分第一)
- R≈3.80:最近参与活动间隔极短,持续高频参与
- F≈3.49:活动参与次数最多,对活动响应度极高
- M≈3.62:活动总销量最高,是单品销售的核心贡献者
落地动作
- 资源倾斜:优先保障该类门店的单品库存、活动物料(试吃装、陈列展架、海报),最大化销售潜力
- 方法复制:提炼该类门店的活动落地方法论(如黄金陈列位、导购推荐话术、试吃活动玩法),进行宣传推广
Cluster 2:高活跃低转化潜力门店
特征拆解(R 极高,F/M 极低)
- R≈3.76:最近参与活动间隔极短,近期活跃度拉满,门店对活动有明确参与意愿
- F≈1.90:活动参与频次极低,仅偶尔参与,未形成稳定参与习惯
- M≈2.01:活动总销量极低,未转化为实际销售
落地动作
- 问题定位:诊断低转化原因(如陈列不佳、导购推荐不足、试吃不到位),制定针对性运营方案
Cluster 3:沉睡有基础唤醒门店
特征拆解(R 极低,F/M 中等)
- R≈1.59:最近参与活动间隔很长,长期未参与,处于沉睡状态
- F≈2.18:历史有一定的活动参与频次,并非完全无活动经验
- M≈2.42:历史有一定的销量贡献,有单品销售基础
落地动作
- 触达唤醒:通过区域督导上门沟通、门店专属社群通知,推送最新活动政策(如总部补贴、零库存试销方案)
- 了解门店未参与的痛点(担心库存积压、对产品不熟悉),针对性解决
Cluster 4:低活跃低贡献低效门店
特征拆解(全维度得分最低)
- R≈1.32:最近参与活动间隔极长,几乎不参与活动
- F≈1.08:活动参与次数极少,完全无活动参与习惯
- M≈1.10:活动总销量几乎为 0,销售贡献低
落地动作
- 诊断筛选:对该类门店进行逐一诊断,区分两类情况:
- 客观不适合(门店位置、客群不匹配):标记为「单品低潜力门店」,减少该单品活动推送与资源投放
- 主观不重视:纳入重点督导范围
六、代码模块分析
总览
本项目代码构建了「数据预处理→RFM指标量化→智能聚类→可视化分析→业务落地」的完整闭环,模块化、可复用,为精细化运营提供数据支撑。
分模块拆解
1. 依赖与全局配置模块
- 导入核心分析库,统一环境配置,保障代码稳定运行
2. 工具函数封装模块
- 封装R/FM打分、肘部图绘制函数,提升代码复用性
3. 数据加载与预处理模块
- 数据清洗、日期标准化、按门店聚合计算RFM核心指标
4. RFM打分与可视化模块
- 分位数打分+组合分数可视化,呈现门店分层基础
5. KMeans聚类分析模块
- 数据标准化+肘部法则选k+聚类分层,实现门店价值划分
6. 聚类结果可视化与输出模块
- 分群分布可视化+指标统计,为运营策略提供数据依据
总结
代码结构清晰,逻辑严谨,全链路打通,可快速复用至全品类活动分析,具备极强的扩展性与业务价值。