机器学习预测模型 · 用电行为分析 · 可交互可视化
模拟数据 | 家庭数: 5,000 | 样本: 150,000
本数据集分析家庭用电行为模式,包含房屋类型、家庭规模、是否有空调、月份、星期几等多个维度。
| 字段 | 说明 | 取值 |
|---|---|---|
| htype | 房屋类型 | apartment/house/villa |
| famsize | 家庭人口 | 1-5人 |
| ac | 是否有空调 | 0/1 |
| month | 月份 | 1-12 |
| dow | 星期几 | 0-6 |
| kwh | 用电量 | kWh/天 |
别墅(villa)平均用电47kWh/天,是公寓(apt)的2.3倍!房屋类型是影响用电量的最大因素。
家庭每增加一人,用电量增加约4-5kWh/天。5口之家比独居多用80%电量。
冬季(12-2月)和夏季(6-8月)用电量明显高于春秋两季。冬季34kWh vs 春季24kWh,差距达40%!
空调(ac)特征重要性仅5.2%,远低于房屋类型(57%)和家庭规模(19%)。也许样本中空调普及率太均匀了。
月份相关性只有0.15,而房屋类型对用电量的影响是月份的4倍!
周末平均32.8kWh vs 工作日27.4kWh,高出20%!人们在家时间多,用电自然更多。
| 模型 | R² | RMSE(kWh) | MAE(kWh) |
|---|---|---|---|
| Linear Regression | 0.659 | 8.21 | 6.45 |
| Ridge | 0.659 | 8.21 | 6.45 |
| Random Forest ⭐ | 0.845 | 5.55 | 4.12 |
| Gradient Boosting | 0.842 | 5.60 | 4.18 |
Random Forest表现最佳,R²=0.845,能解释84.5%的用电量变化。预测误差仅5.55kWh。
房屋类型(57%):决定性因素,别墅用电是公寓2倍以上
家庭规模(19%):人口多,用电自然多
月份(15%):冬夏季用电高峰