机器学习编程:从编码到深度学习
上QQ阅读APP看书,第一时间看更新

2.2.3 进行训练

现在通过编写代码来实现线性回归的第一部分:给定一组带标签的样本(数组X和数组Y),找到一条能够拟合这些样本数据的直线w。你能想出一个办法吗?你可以暂停阅读一分钟,好好想想。这是一个很有趣的问题。

你可能认为有一种简单的方法可以求出w,那就是使用数学方法。毕竟,一定会有某种公式存在,对列出一系列点使用这种公式找到一条直线来近似拟合它们。我们可以用谷歌来搜索这种公式,甚至可以找到一个程序库来实现这项工作。

事实上,这样的公式确实存在……但我们不会使用它的,因为那是一条死胡同。如果使用某个公式来寻找用于拟合某组样本数据的直线,那么就会在处理曲线函数模型时陷入困境。我们最好能够找到一种更加通用的解决方案,也就是说找到一种适用于任何数学模型的解决方案。

那么,数学家的方法就到此为止了。让我们来看看程序员的方法。