线性代数的本质——注1
以2维空间为例,有一组基向量。这个二维空间中的任何一个向量都可以用这组基向量来表示,所以说这个二维空间是由这组基向量展开的空间。具体表现为:
其中是任意实数,也是的值。
空间中的任何一个向量,只需要对基向量进行缩放和相加就可以得到,这也说明了向量加法和数乘法的特别重要。
因此
自然有无数组这样的基向量。在二维空间中,我们通常选择上面的作为基向量。
变换其实相当于一个函数。在这种情况下,该函数输入一个向量并输出一个向量。
输入和输出的向量维数可以不同。
之所以用变换而不是函数来定义,是因为变换强调的是一个运动的过程。比如二维空间,我们可以想象向量经过线性变换后,移动到空间的其他位置。
有两种变换:线性变换和非线性变换。本节讲线性变换及其与矩阵的关系。
把向量想象成一个箭头,那么线性变换就是指起点在原点的向量在不同空间的移动,保持向量数的乘加不变性。
这个不同的空间可以理解为
例如,通过线性变换将三维向量转换成三维向量。
或者通过线性变换将三维向量转换成二维向量。
上面提到的1其实是2的特例。如果变换后空间维度不同,则空间定义的基向量一定已经改变。
直觉上,我们可以使用
表示线性变换的两个条件。
我们知道,线性变换就是将空间中的所有矢量移动到一个新的位置。在这个过程中,向量的起点保持不变。那么你如何追踪任何一个被转换的向量呢?
从上一节我们知道,向量实际上是基向量的线性组合,任何向量都可以用基向量来表示。
怎么知道基向量的变换?在二维空间中,我们只需要观察这组基向量。而线性变换后基向量的系数就是线性变换前基向量的系数,也就是线性变换前的坐标。
已知的
即线性变换后变成,即此时对应变换成,,和
证明
根据上面线性变换的定义:
因此...
所以只要知道变换后的基向量坐标,就可以进行线性变换。
现在假设线性变换后的基向量已知。
借用上面证明中的已知条件。
,
然后我们将坐标“打包”在一个新的网格中,我们称之为矩阵。
看到这里,大家应该明白了,原矩阵是线性变换后基向量的拼接。
在日常应用中,通常会给出矩阵,所以本节一开始就假设变换后的基向量已知为真,并且是矩阵的元素。
那么空间中的任何变换向量都可以用基向量来表示。
请看下面的例子:
有一个矩阵,还有一个向量。在矩阵的“作用”下,新的矢量坐标(移动到新的位置)如下:
请仔细阅读并跟随文章。
这种形式是类似的,相当于基向量的系数,
它是线性变换后的基向量。
因此,矩阵与向量相乘的直观解释如下:
由于矩阵表示空间的线性变换,矩阵乘法意味着变换后的基向量再次进行线性变换,即原空间进行两次线性变换。
两次变换的效果相当于两个矩阵相乘得到的1个矩阵的一次变换的效果。
主要内容来源于哔哩哔哩Upmaster @3Blue1Brown的线性代数的精髓。