passwordcommenttypestatusdateslugsummarytagscategoryiconAI custom autofill梯度爆炸应检查何处的损失出现NaN启用梯度裁剪找出对应损失函数计算中何处出现NaN检查整个网络输入侧,确保输入数据的合理范围。如:数据是否归一化检查学习率、损失函数计算公式···发现其中可能导致梯度爆炸的计算过程找出NaN携带NaN的变量,可以限制模型最后输出层/手动将其置为epsilon查看一些损失,可能会有一项reduction,看是否将mean写成了sum使用vscode 逐步debug,在调试控制台对可疑变量打印输出:上一篇项目哲学下一篇北京百日漂流下一篇北京百日漂流作者:Gintmr链接:https://gintmr.20250130.xyz//article/1ddaf1ce-0c90-805c-ab8a-c7c1b627c957声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。