【线性代数的本质】矩阵与线性变换

本文已收录于 线性代数的本质学习笔记 系列,共计 9 篇,本篇是第 2 篇

矩阵

矩阵就是坐标轴的“变换方式”(拉长或旋转)。

矩阵最直观的理解当然是一个写成方阵的数字$$\begin{bmatrix}
1&2 \\
3&4
\end{bmatrix}$$,这几节的核心是为了说明矩阵其实就是一种向量变换(至于什么是变换下面会讲),并附带一种不用死记硬背的考虑矩阵向量乘法的方法。

变换

线性变换是操作空间的一种手段。当每看到一个矩阵时,都可以把它理解为空间的特殊变换。

矩阵代表一个特定的线性变换,而矩阵与向量相乘,就是将线性变换作用于向量。

矩阵与向量相乘就是将线性变换作用于那个向量。

变换本质上是函数的一种花哨的说法,它接受输入内容,并输出对应结果,矩阵变换同理,如下图:

那既然两者意思相同,为何还要新发明一个词语呢?

因为变换的表达方法暗示了我们可以用运动的方法来理解向量的函数这一概念,可以用可视化的方法来展现这组变换,即输入-输出关系。

这世界上有非常多优美的变换,各种各样对空间的变换所产生的效果很美妙的:

线性变换

线性变换是一种特殊类型的变换,它有着以下的限制:

  • 直线在变换后仍然保持为直线,不能有所弯曲。
  • 原点必须保持固定。

线性变换是“保持网格线平行且等距分布”的变换。

用数值描述线性变换——矩阵

解释:变换后的这个向量就是x乘以变换后的i帽(1, -2)加上y乘以变换后的j帽(3, 0),简单运算后就知道它落在坐标(1x+3y, -2x+0y)上。

这告诉我们一个二维变换可由四个数字完全确定。我们将这四个数字包裹在一起——叫做矩阵。

所以,总结如下:

Step1:绿色i帽(x轴)进行移动(变换)
Step2:红色j帽(y轴)进行移动(变换)
Step3:目标向量x轴坐标值与i帽变换后向量进行向量乘法
Step4:目标向量y轴坐标值与j帽变换后向量进行向量乘法
Step5:两者进行向量加法,得到线性变换结果

更加一般的情况,我们用变量来代替其中的具体值:

绿色代表i帽变换后的向量,红色代表j帽换后的向量;黑色的x和y是向量。

计算方法是取出向量的坐标,他们分别与矩阵特定的列相乘,然后将结果相加即可。这就是我们常说的矩阵乘法公式。

用矩阵练习一些线性变换

将整个空间旋转90度:

剪切:

反过来从矩阵出发,如果变化后的i帽和j帽是线性相关的,那么变化后向量的张量就是一维空间,是一条直线:

线性相关了,坍塌成一维空间了。

通过计算矩阵,会发现行列式=0(行列式就是面积)。行列式等于0意味着矩阵不可逆,即无法从一条直线还原回原来向量张成的二维空间。即如果这个矩阵表示的变换将这个向量降维了,降维后无法回到高维,那就是不可逆。

即:矩阵记录的是一种变换。

矩阵的乘法

复合变换

如何描述先旋转再剪切的操作呢?

一个通俗的方法是首先左乘旋转矩阵然后左乘剪切矩阵。

两个矩阵的乘积需要从右向左读,类似函数的复合。其实矩阵就像函数的复合,例如f(f(x))这样

矩阵相乘本就是可看成列向量的排列相乘。

举个例子:

这一过程具有普适性:

矩阵计算规则的证明

矩阵乘法的顺序:

矩阵乘法的结合性

(AB)C=A(BC)(AB)C = A(BC)

根据线性变化我们可以得出,矩阵的乘法都是以CBA的顺序变换得到,所以他们本质上相同,通过变化的形式解释比代数计算更加容易理解。

三维空间的线性变化

 

 

参考文献:【直观详解】线性代数的本质 | Go Further | Stay Hungry, Stay Foolish (charlesliuyx.github.io)

作者: 高志远

高志远,24岁,男生

发表评论

邮箱地址不会被公开。