线性代数的本质——注1

理解向量有三种方式,如下所示:

以2维空间为例,有一组基向量。这个二维空间中的任何一个向量都可以用这组基向量来表示,所以说这个二维空间是由这组基向量展开的空间。具体表现为:

其中是任意实数,也是的值。

空间中的任何一个向量,只需要对基向量进行缩放和相加就可以得到,这也说明了向量加法和数乘法的特别重要。

因此

自然有无数组这样的基向量。在二维空间中,我们通常选择上面的作为基向量。

变换其实相当于一个函数。在这种情况下,该函数输入一个向量并输出一个向量。

输入和输出的向量维数可以不同。

之所以用变换而不是函数来定义,是因为变换强调的是一个运动的过程。比如二维空间,我们可以想象向量经过线性变换后,移动到空间的其他位置。

有两种变换:线性变换和非线性变换。本节讲线性变换及其与矩阵的关系。

把向量想象成一个箭头,那么线性变换就是指起点在原点的向量在不同空间的移动,保持向量数的乘加不变性。

这个不同的空间可以理解为

例如,通过线性变换将三维向量转换成三维向量。

或者通过线性变换将三维向量转换成二维向量。

上面提到的1其实是2的特例。如果变换后空间维度不同,则空间定义的基向量一定已经改变。

直觉上,我们可以使用

表示线性变换的两个条件。

我们知道,线性变换就是将空间中的所有矢量移动到一个新的位置。在这个过程中,向量的起点保持不变。那么你如何追踪任何一个被转换的向量呢?

从上一节我们知道,向量实际上是基向量的线性组合,任何向量都可以用基向量来表示。

怎么知道基向量的变换?在二维空间中,我们只需要观察这组基向量。而线性变换后基向量的系数就是线性变换前基向量的系数,也就是线性变换前的坐标。

已知的

即线性变换后变成,即此时对应变换成,,和

证明

根据上面线性变换的定义:

因此...

所以只要知道变换后的基向量坐标,就可以进行线性变换。

现在假设线性变换后的基向量已知。

借用上面证明中的已知条件。

,

然后我们将坐标“打包”在一个新的网格中,我们称之为矩阵。

看到这里,大家应该明白了,原矩阵是线性变换后基向量的拼接。

在日常应用中,通常会给出矩阵,所以本节一开始就假设变换后的基向量已知为真,并且是矩阵的元素。

那么空间中的任何变换向量都可以用基向量来表示。

请看下面的例子:

有一个矩阵,还有一个向量。在矩阵的“作用”下,新的矢量坐标(移动到新的位置)如下:

请仔细阅读并跟随文章。

这种形式是类似的,相当于基向量的系数,

它是线性变换后的基向量。

因此,矩阵与向量相乘的直观解释如下:

由于矩阵表示空间的线性变换,矩阵乘法意味着变换后的基向量再次进行线性变换,即原空间进行两次线性变换。

两次变换的效果相当于两个矩阵相乘得到的1个矩阵的一次变换的效果。

主要内容来源于哔哩哔哩Upmaster @3Blue1Brown的线性代数的精髓。