线性代数的本质——注1

理解向量有三种方式，如下所示:

以2维空间为例，有一组基向量。这个二维空间中的任何一个向量都可以用这组基向量来表示，所以说这个二维空间是由这组基向量展开的空间。具体表现为:

其中是任意实数，也是的值。

空间中的任何一个向量，只需要对基向量进行缩放和相加就可以得到，这也说明了向量加法和数乘法的特别重要。

因此

自然有无数组这样的基向量。在二维空间中，我们通常选择上面的作为基向量。

变换其实相当于一个函数。在这种情况下，该函数输入一个向量并输出一个向量。

输入和输出的向量维数可以不同。

之所以用变换而不是函数来定义，是因为变换强调的是一个运动的过程。比如二维空间，我们可以想象向量经过线性变换后，移动到空间的其他位置。

有两种变换:线性变换和非线性变换。本节讲线性变换及其与矩阵的关系。

把向量想象成一个箭头，那么线性变换就是指起点在原点的向量在不同空间的移动，保持向量数的乘加不变性。

这个不同的空间可以理解为

例如，通过线性变换将三维向量转换成三维向量。

或者通过线性变换将三维向量转换成二维向量。

上面提到的1其实是2的特例。如果变换后空间维度不同，则空间定义的基向量一定已经改变。

直觉上，我们可以使用

表示线性变换的两个条件。

我们知道，线性变换就是将空间中的所有矢量移动到一个新的位置。在这个过程中，向量的起点保持不变。那么你如何追踪任何一个被转换的向量呢？

从上一节我们知道，向量实际上是基向量的线性组合，任何向量都可以用基向量来表示。

怎么知道基向量的变换？在二维空间中，我们只需要观察这组基向量。而线性变换后基向量的系数就是线性变换前基向量的系数，也就是线性变换前的坐标。

已知的

即线性变换后变成，即此时对应变换成，，和

证明

根据上面线性变换的定义:

因此...

所以只要知道变换后的基向量坐标，就可以进行线性变换。

现在假设线性变换后的基向量已知。

借用上面证明中的已知条件。

然后我们将坐标“打包”在一个新的网格中，我们称之为矩阵。

看到这里，大家应该明白了，原矩阵是线性变换后基向量的拼接。

在日常应用中，通常会给出矩阵，所以本节一开始就假设变换后的基向量已知为真，并且是矩阵的元素。

那么空间中的任何变换向量都可以用基向量来表示。

请看下面的例子:

有一个矩阵，还有一个向量。在矩阵的“作用”下，新的矢量坐标(移动到新的位置)如下:

请仔细阅读并跟随文章。

这种形式是类似的，相当于基向量的系数，

它是线性变换后的基向量。

因此，矩阵与向量相乘的直观解释如下:

由于矩阵表示空间的线性变换，矩阵乘法意味着变换后的基向量再次进行线性变换，即原空间进行两次线性变换。

两次变换的效果相当于两个矩阵相乘得到的1个矩阵的一次变换的效果。

主要内容来源于哔哩哔哩Upmaster @3Blue1Brown的线性代数的精髓。