⚡ 家庭用电量分析报告

机器学习预测模型 · 用电行为分析 · 可交互可视化

模拟数据 | 家庭数: 5,000 | 样本: 150,000

29.0
日均用电(kWh)
84.5%
模型准确率(R²)
5.6
预测误差(kWh)

📊 一、数据概览

本数据集分析家庭用电行为模式,包含房屋类型、家庭规模、是否有空调、月份、星期几等多个维度。

1.1 数据字段

字段说明取值
htype房屋类型apartment/house/villa
famsize家庭人口1-5人
ac是否有空调0/1
month月份1-12
dow星期几0-6
kwh用电量kWh/天

🔍 二、探索性分析

2.1 房屋类型用电对比

🏠 发现

别墅(villa)平均用电47kWh/天,是公寓(apt)的2.3倍!房屋类型是影响用电量的最大因素。

2.2 家庭规模与用电

👨‍👩‍👧 发现

家庭每增加一人,用电量增加约4-5kWh/天。5口之家比独居多用80%电量。

2.3 月份用电规律

📅 发现

冬季(12-2月)和夏季(6-8月)用电量明显高于春秋两季。冬季34kWh vs 春季24kWh,差距达40%

2.4 周末vs工作日

2.5 相关性热力图

💡 三、反直觉发现

🔄 反直觉 #1: 空调影响没那么大!

空调(ac)特征重要性仅5.2%,远低于房屋类型(57%)和家庭规模(19%)。也许样本中空调普及率太均匀了。

🔄 反直觉 #2: 月份不是最重要的!

月份相关性只有0.15,而房屋类型对用电量的影响是月份的4倍!

🔄 反直觉 #3: 周末用电反而更高!

周末平均32.8kWh vs 工作日27.4kWh,高出20%!人们在家时间多,用电自然更多。

🤖 四、机器学习预测模型

4.1 模型对比

模型RMSE(kWh)MAE(kWh)
Linear Regression0.6598.216.45
Ridge0.6598.216.45
Random Forest ⭐0.8455.554.12
Gradient Boosting0.8425.604.18

🎯 模型结论

Random Forest表现最佳,R²=0.845,能解释84.5%的用电量变化。预测误差仅5.55kWh。

4.2 特征重要性

📊 重要性解读

房屋类型(57%):决定性因素,别墅用电是公寓2倍以上

家庭规模(19%):人口多,用电自然多

月份(15%):冬夏季用电高峰

💡 五、结论与建议

5.1 主要发现

  1. 房屋类型是影响用电量的最大因素,占比57%
  2. 家庭规模每增加一人,用电量增加约4-5kWh/天
  3. 季节影响显著:冬夏季比春秋季高40%
  4. 周末用电比工作日高20%

5.2 节能建议

5.3 模型应用