在二维空间中,我们已经了解了一些几何映射的例子,例如缩放和旋转,它们都是线性变换。现在我们可以将它们转化为矩阵形式。我们将重点研究其中的五种:拉伸、剪切、旋转、反射和投影。
这些简单的变换不仅对于建立直觉至关重要,而且在计算机视觉中也经常应用。翻转、旋转和拉伸是图像增强流程的重要组成部分, 它们能够极大地提升模型的性能。
本文的主要内容包括:
- 欧氏平面中的线性变换
- 拉伸
- 旋转
- 剪切
- 反射
- 正交投影
1 欧氏平面中的线性变换
我们刚刚看到,线性变换可以用基组的图像来描述。从几何角度来看,它们是将平行六面体映射到平行六面体的函数。
由于线性关系,你可以将其想象成扭曲了由基组确定的网格。

图 4.6:线性变换如何扭曲由基向量确定的网格
在二维空间中,我们已经了解了一些几何映射的例子,例如缩放和旋转,它们都是线性变换。现在我们可以将它们转化为矩阵形式。我们将重点研究其中的五种:拉伸、剪切、旋转、反射和投影。
这些简单的变换不仅对于建立直觉至关重要,而且在计算机视觉中也经常应用。翻转、旋转和拉伸是图像增强流程的重要组成部分, 它们能够极大地提升模型的性能。
1.1 拉伸
最简单的方法是广义的缩放。我们在上面的示例 1 中已经看到了它的变体(参见4.1 节)。以矩阵形式表示,它表示为

此类线性变换可以通过绘制由标准基𝐞1 = (1, 0)、𝐞2 = (0, 1) 确定的单位正方形的图像来可视化。

图 4.7:拉伸
1.2 旋转
旋转由矩阵给出

要理解原因,请回想一下,变换矩阵的每一列都描述了基向量的像。(1, 0) 的旋转由 (cos 𝛼,sin 𝛼) 给出,而 (0, 1) 的旋转由 (cos(𝛼 + 𝜋/2),sin(𝛼 + 𝜋/2)) 给出。如图 4.8 所示。

图 4.8:旋转矩阵解释
如上所述,我们可以将单位正方形的图像可视化,以获得对正在发生的事情的几何洞察力。

图 4.9:旋转
1.3 剪切
另一个重要的几何变换是剪切,它在物理学中经常应用。剪切力(https://en.wikipedia.org/wiki/Shear_force) 是作用于同一物体的一对方向相反的力。

图 4.10:剪切
其矩阵形式为

其中 \(𝑆_𝑥\) 、 \(𝑆_𝑦\) 和 𝑆 表示 𝑥、𝑦 和两个方向上的剪切变换。
1.4 反射
到目前为止,我们在欧氏平面上看到的所有变换都保留了空间的“方向”。然而,情况并非总是如此。矩阵给出的变换

充当关于𝑥和𝑦轴的反射。

图 4.11:反射
与旋转结合时,我们可以使用反射来翻转基。例如,变换将\(𝐞_1\) 映射到\(𝐞_2\),将\(𝐞_2\) 映射到\(𝐞_1\)。


图 4.12:交换\(𝐞_1\) 和\(𝐞_2\) 是反射和旋转
这些类型的变换在理解行列式中起着至关重要的作用,我们将在下一章中看到。
一般来说,在高维空间中,反射很容易定义。例如,

是\(ℝ^3\)的反射,将\(𝐞^3\)翻转到相反方向。这就像照镜子一样:左边变右边,右边变左边。
反射可以多次翻转方向。变换如下

翻转\(𝐞_2\)和\(𝐞_3\),改变方向两次。稍后我们将看到,给定变换的“方向变化次数”是其基本描述之一。
1.5 正交投影
最重要的变换之一(不仅在二维中)是正交投影。我们在2.2.3节讨论内积及其几何表示时已经见过它。仔细观察就会发现,它们其实是线性变换。

图 4.13:正交投影
回想一下 (2.7),𝑥 到某个 𝑦 的正交投影可以写成

⟨⋅, ⋅⟩ 的双线性随即意味着 \(proj_𝐲(𝐱)\) 也是线性的。借助一些代数知识,我们可以将其重写为矩阵形式。我们有

因此,

请注意

标准基向量的像并非线性无关。因此,平面在\(proj_𝐲\)下的像是span(𝐲),它是一个一维子空间。从这个例子中,我们可以看出,向量空间在线性变换下的像不一定与起始空间的维数相同。
通过这些例子和知识的积累,我们对线性变换——神经网络最基本的组成部分——有了基本的了解。在下一节中,我们将研究线性变换如何影响向量空间的几何结构。