项目概述

本项目针对线下零食连锁品牌新品活动效果不佳的问题,通过RFM用户分层模型+KMeans聚类算法,完成门店价值分层,识别不同类型门店的活动参与特征与销售贡献,输出可落地的精细化运营策略,实现资源精准投放、活动效果提升的核心目标。

一、项目背景

开展新品活动后,活动效果不佳,需针对不同的门店情况,精细化运营:

  • 识别高价值核心门店,保障核心资源倾斜;
  • 筛选低价值门店,提高转化;
  • 定位流失风险门店,制定召回策略。

二、技术栈

类别 技术/工具
数据处理 Python、Pandas、NumPy
可视化 Matplotlib、Seaborn
机器学习 Scikit-learn(StandardScaler、KMeans)

三、核心功能模块

1. 数据预处理

  • 日期格式标准化转换;
  • 剔除非核心字段,聚焦门店消费核心维度;
  • 异常值/警告屏蔽,保证分析流程稳定。

2. RFM指标计算

基于门店消费行为计算核心指标:

  • R(Recency):门店最近一次消费与活动结束日的间隔天数;
  • F(Frequency):门店消费频次(活动期间消费次数);
  • M(Monetary):门店消费金额/销量(活动期间总销量)。

3. RFM打分与可视化

  • 基于分位数(25%/50%/75%)对R/F/M指标分段打分;
  • 可视化RFM组合分数分布(彩虹渐变配色柱状图)。

肘部法则选最优k值

肘部法则选最优k值

4. KMeans聚类分析

  • 数据标准化消除量纲影响;
  • 肘部法则选择最优聚类数量(k=4);
  • 门店价值分层聚类,并可视化分群结果。

5. 分群特征统计

输出各聚类分群的RFM打分均值,量化不同门店群的核心特征。

四、项目亮点

  • 业务贴合性:采用真实数据,聚焦业务场景,指标设计贴合行业特点;
  • 数据可视化:肘部法则图、分群分布图,直观呈现分析结果;
  • 算法落地性:肘部法则科学选k,避免聚类数量主观判断;
  • 可解释性强:聚类结果映射为业务化分群名称(如高价值核心门店),便于运营理解。

五、分析结果与业务建议

RFM组合分数分布 门店聚类分群分布

Cluster 1:核心高价值标杆门店

特征拆解(全维度得分第一)

  • R≈3.80:最近参与活动间隔极短,持续高频参与
  • F≈3.49:活动参与次数最多,对活动响应度极高
  • M≈3.62:活动总销量最高,是单品销售的核心贡献者

落地动作

  • 资源倾斜:优先保障该类门店的单品库存、活动物料(试吃装、陈列展架、海报),最大化销售潜力
  • 方法复制:提炼该类门店的活动落地方法论(如黄金陈列位、导购推荐话术、试吃活动玩法),进行宣传推广

Cluster 2:高活跃低转化潜力门店

特征拆解(R 极高,F/M 极低)

  • R≈3.76:最近参与活动间隔极短,近期活跃度拉满,门店对活动有明确参与意愿
  • F≈1.90:活动参与频次极低,仅偶尔参与,未形成稳定参与习惯
  • M≈2.01:活动总销量极低,未转化为实际销售

落地动作

  • 问题定位:诊断低转化原因(如陈列不佳、导购推荐不足、试吃不到位),制定针对性运营方案

Cluster 3:沉睡有基础唤醒门店

特征拆解(R 极低,F/M 中等)

  • R≈1.59:最近参与活动间隔很长,长期未参与,处于沉睡状态
  • F≈2.18:历史有一定的活动参与频次,并非完全无活动经验
  • M≈2.42:历史有一定的销量贡献,有单品销售基础

落地动作

  • 触达唤醒:通过区域督导上门沟通、门店专属社群通知,推送最新活动政策(如总部补贴、零库存试销方案)
  • 了解门店未参与的痛点(担心库存积压、对产品不熟悉),针对性解决

Cluster 4:低活跃低贡献低效门店

特征拆解(全维度得分最低)

  • R≈1.32:最近参与活动间隔极长,几乎不参与活动
  • F≈1.08:活动参与次数极少,完全无活动参与习惯
  • M≈1.10:活动总销量几乎为 0,销售贡献低

落地动作

  • 诊断筛选:对该类门店进行逐一诊断,区分两类情况:
    • 客观不适合(门店位置、客群不匹配):标记为「单品低潜力门店」,减少该单品活动推送与资源投放
    • 主观不重视:纳入重点督导范围

六、代码模块分析

总览

本项目代码构建了「数据预处理→RFM指标量化→智能聚类→可视化分析→业务落地」的完整闭环,模块化、可复用,为精细化运营提供数据支撑。

分模块拆解

1. 依赖与全局配置模块

  • 导入核心分析库,统一环境配置,保障代码稳定运行

2. 工具函数封装模块

  • 封装R/FM打分、肘部图绘制函数,提升代码复用性

3. 数据加载与预处理模块

  • 数据清洗、日期标准化、按门店聚合计算RFM核心指标

4. RFM打分与可视化模块

  • 分位数打分+组合分数可视化,呈现门店分层基础

5. KMeans聚类分析模块

  • 数据标准化+肘部法则选k+聚类分层,实现门店价值划分

6. 聚类结果可视化与输出模块

  • 分群分布可视化+指标统计,为运营策略提供数据依据

总结

代码结构清晰,逻辑严谨,全链路打通,可快速复用至全品类活动分析,具备极强的扩展性与业务价值。