🏦 银行电话营销分析报告

机器学习预测模型 · 用户行为分析 · 可交互可视化

数据来源: Kaggle Bank Marketing | 样本数: 41,188 | 变量数: 21

41,188
样本数
11.27%
营销成功率
AUC 0.95
模型预测能力

📊 一、数据概览与预处理

银行电话营销数据集是营销分析领域的经典数据集,目标是预测客户是否会订阅定期存款产品。该数据集包含了客户基本信息、联系记录、社会经济指标等多维度数据。

1.1 变量说明

类别变量名说明
客户数据age年龄
job职业类型(12类)
marital婚姻状况
education教育程度(8类)
default是否有信用违约
housing是否有房贷
loan是否有个人贷款
联系数据contact联系方式(手机/固话)
month联系月份
day_of_week联系日期
duration通话时长(秒)
campaign本次营销联系次数
历史数据pdays上次联系后天数
previous之前联系次数
poutcome上次营销结果
经济指标emp.var.rate就业变化率
cons.price.idx消费者价格指数
cons.conf.idx消费者信心指数
euribor3m欧元银行同业拆借利率
nr.employed就业人数

1.2 目标变量分布

数据集存在明显的类别不平衡:

🔍 二、探索性数据分析

2.1 特征相关性热力图

📈 热力图发现

通话时长(duration)与目标变量正相关最强,是最重要的预测因子。

经济指标高度相关:euribor3m、nr.employed、emp.var.rate之间相关系数高达0.9+。

2.2 客户年龄分布

2.3 职业与成功率

💡 职业分析发现

学生成功率最高(31.4%),远超平均水平!

退休人员次之(25.2%),有更多时间和兴趣。

蓝领成功率最低(6.9%)。

2.4 婚姻状况成功率

2.5 教育程度成功率

💡 三、反直觉发现

🔄 反直觉发现 #1: 老年人更容易被营销!

65岁以上老年人成功率高达46.8%,是年轻人的2-3倍!可能原因:老年人有更多储蓄、对定期存款需求更高、有时间接听电话。

🔄 反直觉发现 #2: 经济越差,营销越成功?

euribor3m(欧元利率)与成功率呈强负相关(-0.31)。经济差的时候,人们更愿意存钱!

🔄 反直觉发现 #3: 3月和12月成功率最高!

3月(50.5%)和12月(48.9%)成功率远超其他月份,可能与年终奖金、节日消费习惯有关。

🔄 反直觉发现 #4: 通话时长是"作弊"特征

通话超过600秒(10分钟),成功率高达48.6%!但这个特征在营销前无法知道,属于"事后诸葛亮"。

🤖 四、机器学习预测模型

4.1 模型性能对比

我们训练了三种分类模型,使用AUC-ROC作为主要评估指标(因为数据不平衡):

模型准确率AUC-ROC说明
Logistic Regression85.7%0.939可解释性强
Random Forest91.7%0.951抗过拟合
Gradient Boosting ⭐92.1%0.954最佳性能

4.2 特征重要性分析

🎯 特征重要性解读

通话时长(duration):贡献度41.2%,绝对主导地位!但这是"作弊"特征。

经济指标:euribor3m(10%)、nr.employed(6.5%)、emp.var.rate(6.4%)合计贡献23%。

客户特征:年龄(6%)、职业(3.1%)、教育(3%)也有一定贡献。

💡 五、结论与营销建议

5.1 主要发现

  1. 目标群体:优先联系学生、退休人员、高学历人群
  2. 时间选择:3月、12月是黄金时间
  3. 经济时机:经济下行期是营销好时机
  4. 沟通策略:手机比固话效果好(14.7% vs 5.2%)

5.2 实践建议

5.3 模型应用价值