假设我们有n组观测数据点(x_i, y_i),其中i=1,2,...,n。我们的目标是找到一个函数f(x) = ax + b(这里以线性函数为例),使得实际值y_i与预测值f(x_i)之间的差异尽可能小。这种差异通常用残差e_i表示,即e_i = y_i - f(x_i)。
为了实现这一目标,我们需要定义一个目标函数,该函数衡量所有残差平方和的大小。这个目标函数可以写成:
S(a,b) = Σ(y_i - (ax_i + b))^2
其中Σ表示对所有的数据点求和。我们的任务就是找到a和b的值,使得S(a,b)达到最小。
要找到使S(a,b)最小的a和b,我们可以使用微积分中的偏导数技巧。具体地,分别对a和b求偏导数,并令它们等于零,得到两个方程:
∂S/∂a = 0
∂S/∂b = 0
解这组方程就可以得到a和b的具体表达式。对于线性情况下的最小二乘法,最终得到的公式为:
a = [Σ(x_i - x̄)(y_i - ȳ)] / [Σ(x_i - x̄)^2]
b = ȳ - ax̄
这里x̄和ȳ分别是x_i和y_i的平均值。有了这两个公式后,我们就能够确定最佳拟合直线了。
需要注意的是,虽然上述讨论集中在了线性最小二乘法上,但最小二乘法同样适用于非线性模型。在这种情况下,可能需要采用迭代算法如梯度下降等来求解最优参数。
总之,最小二乘法提供了一种有效且直观的方式来处理数据拟合问题,在科学研究、工程应用等多个领域都有着重要的地位。