(转)神经网络性能, 复杂度分析

Posted by zihuaweng on August 25, 2018

Roofline Model与深度学习模型的性能分析

https://zhuanlan.zhihu.com/p/34204282

卷积神经网络的复杂度分析

https://zhuanlan.zhihu.com/p/31575074

takeaways

  1. 时间复杂度决定了模型的训练/预测时间。如果复杂度过高,则会导致模型训练和预测耗费大量时间,既无法快速的验证想法和改善模型,也无法做到快速的预测。
  2. 空间复杂度决定了模型的参数数量。由于维度诅咒的限制,模型的参数越多,训练模型所需的数据量就越大,而现实生活中的数据集通常不会太大,这会导致模型的训练更容易过拟合。
  3. 当我们需要裁剪模型时,由于卷积核的空间尺寸通常已经很小(3x3),而网络的深度又与模型的表征能力紧密相关,不宜过多削减,因此模型裁剪通常最先下手的地方就是通道数。