关于算法本质的深度思考 | 点击卡片阅读详细内容
从token级到序列级优化的范式转变,Qwen团队提出的GRPO改良版
为什么梯度下降是最优雅的解法?从优化理论谈到人生哲学
从函数逼近到世界模型,层次化表示与深度学习
为什么恐惧是最好的老师?正则化与泛化的智慧
注意力作为统一的接口
探索与利用的平衡
生成与判别的辩证法
学会学习