Machine Learning 数据挖掘与可视化分析
数据来源: California Housing Dataset | 样本数: 20,640
我们使用4种机器学习算法对房价进行预测:
| 模型 | R² 分数 | RMSE | MAE |
|---|---|---|---|
| Linear Regression | 0.576 | $74,558 | $53,320 |
| Ridge Regression | 0.576 | $74,552 | $53,320 |
| Random Forest ⭐ | 0.804 | $50,663 | $32,817 |
| Gradient Boosting | 0.776 | $54,222 | $37,164 |
R² 分数达到 0.804,意味着模型可以解释80%的房价变化。预测误差约为 $50,000。