0%

机器学习的数学基础-线性变换(三)

Posted on 2025-10-10 Edited on 2025-11-26

在二维空间中，我们已经了解了一些几何映射的例子，例如缩放和旋转，它们都是线性变换。现在我们可以将它们转化为矩阵形式。我们将重点研究其中的五种：拉伸、剪切、旋转、反射和投影。

这些简单的变换不仅对于建立直觉至关重要，而且在计算机视觉中也经常应用。翻转、旋转和拉伸是图像增强流程的重要组成部分，它们能够极大地提升模型的性能。

本文的主要内容包括：

欧氏平面中的线性变换
拉伸
旋转
剪切
反射
正交投影

1 欧氏平面中的线性变换

我们刚刚看到，线性变换可以用基组的图像来描述。从几何角度来看，它们是将平行六面体映射到平行六面体的函数。

由于线性关系，你可以将其想象成扭曲了由基组确定的网格。

图 4.6：线性变换如何扭曲由基向量确定的网格

在二维空间中，我们已经了解了一些几何映射的例子，例如缩放和旋转，它们都是线性变换。现在我们可以将它们转化为矩阵形式。我们将重点研究其中的五种：拉伸、剪切、旋转、反射和投影。

这些简单的变换不仅对于建立直觉至关重要，而且在计算机视觉中也经常应用。翻转、旋转和拉伸是图像增强流程的重要组成部分，它们能够极大地提升模型的性能。

1.1 拉伸

最简单的方法是广义的缩放。我们在上面的示例 1 中已经看到了它的变体（参见4.1 节）。以矩阵形式表示，它表示为

此类线性变换可以通过绘制由标准基𝐞1 = (1, 0)、𝐞2 = (0, 1) 确定的单位正方形的图像来可视化。

图 4.7：拉伸

1.2 旋转

旋转由矩阵给出

要理解原因，请回想一下，变换矩阵的每一列都描述了基向量的像。(1, 0) 的旋转由 (cos 𝛼,sin 𝛼) 给出，而 (0, 1) 的旋转由 (cos(𝛼 + 𝜋/2),sin(𝛼 + 𝜋/2)) 给出。如图 4.8 所示。

图 4.8：旋转矩阵解释

如上所述，我们可以将单位正方形的图像可视化，以获得对正在发生的事情的几何洞察力。

图 4.9：旋转

1.3 剪切

另一个重要的几何变换是剪切，它在物理学中经常应用。剪切力(https://en.wikipedia.org/wiki/Shear_force) 是作用于同一物体的一对方向相反的力。

图 4.10：剪切

其矩阵形式为

其中 \(𝑆_𝑥\) 、 \(𝑆_𝑦\) 和 𝑆 表示 𝑥、𝑦 和两个方向上的剪切变换。

1.4 反射

到目前为止，我们在欧氏平面上看到的所有变换都保留了空间的“方向”。然而，情况并非总是如此。矩阵给出的变换

充当关于𝑥和𝑦轴的反射。

图 4.11：反射

与旋转结合时，我们可以使用反射来翻转基。例如，变换将\(𝐞_1\) 映射到\(𝐞_2\)，将\(𝐞_2\) 映射到\(𝐞_1\)。

图 4.12：交换\(𝐞_1\) 和\(𝐞_2\) 是反射和旋转

这些类型的变换在理解行列式中起着至关重要的作用，我们将在下一章中看到。

一般来说，在高维空间中，反射很容易定义。例如，

是\(ℝ^3\)的反射，将\(𝐞^3\)翻转到相反方向。这就像照镜子一样：左边变右边，右边变左边。

反射可以多次翻转方向。变换如下

翻转\(𝐞_2\)和\(𝐞_3\)，改变方向两次。稍后我们将看到，给定变换的“方向变化次数”是其基本描述之一。

1.5 正交投影

最重要的变换之一（不仅在二维中）是正交投影。我们在2.2.3节讨论内积及其几何表示时已经见过它。仔细观察就会发现，它们其实是线性变换。

图 4.13：正交投影

回想一下 (2.7)，𝑥 到某个 𝑦 的正交投影可以写成

⟨⋅, ⋅⟩ 的双线性随即意味着 \(proj_𝐲(𝐱)\) 也是线性的。借助一些代数知识，我们可以将其重写为矩阵形式。我们有

因此，

请注意

标准基向量的像并非线性无关。因此，平面在\(proj_𝐲\)下的像是span(𝐲)，它是一个一维子空间。从这个例子中，我们可以看出，向量空间在线性变换下的像不一定与起始空间的维数相同。

通过这些例子和知识的积累，我们对线性变换——神经网络最基本的组成部分——有了基本的了解。在下一节中，我们将研究线性变换如何影响向量空间的几何结构。