我们了解了神经网络识别输入图像的机制,。具体来说,就是根据神经单元中的权重关系来判断。那么,这个权重的大小是如何确定的呢?神经网络中比较重要的一点就是利用网络自学习算法来确定权重大小。
神经网络的参数确定方法分为有监督学习和无监督学习。本文只提到了监督学习,有监督学习是指,为了确定神经网络的权重和偏置,事先给予数据,这些数据称为学习数据。神经网络根据给定的学习数据确定权重和偏置,称为学习。
注:学习数据也称为训练数据。
那么,神经网络是怎样学习的呢?其实思路极其简单:计算神经网络得出的预测值与正解的误差,确定使得误差总和达到最小的权重和偏置。这在数学上称为模型的最优化(下图)。
关于预测值与正解的误差总和,有各种各样的定义。本文采用的是最古典的定义:针对全部学习数据,计算预测值与正解的误差的平方(称为平方误差),然后再相加。这个误差的总和称为代价函数(cost function),用符号CT 表示(T 是Total 的首字母)。
利用平方误差确定参数的方法在数学上称为最小二乘法,它在统计学中是回归分析的常规手段。