训练深度神经网络
训练深度神经网络
梯度消失和梯度爆炸问题
重用预训练层
更快的优化器
学习率调度
通过正则化避免过拟合