形而上学笔记——仿射变换与齐次坐标
/video/bv 1x 7411f 744?p=2
/video/bv 1x 7411f 744?p=3
看完前面的线代系列,看P2就比较简单了,可以用两倍的速度快速复习。在P3,你还可以用基坐标的变换来理解那些2D变换(作者用的是特殊的点推理),比如:
参考/提问/20666664/回答/157400568,这里我只摘录一部分。
简单来说,“仿射变换”就是:“线性变换”+“平移”。
综上所述,线性变换是通过矩阵乘法实现的。
从几何直观来看只有两个要点:
原点不变。
上一节我们说过,线性变换是通过矩阵乘法来实现的,仿射变换不能只通过矩阵乘法来实现,还要通过加法来实现。
参考/提问/26655998/回答/43847213
我来回答,分为两个问题:
首先,我们用一个向量来表示空间中的一个点:r=[rx,ry,rz]
如果要翻译的话,翻译的向量是:t=[tx,ty,tz]
那么正常的做法是:r+t=[rx+tx,ry+ty,rz+tz]
如果不引入齐次坐标,简单通过3×3矩阵乘法实现平移。你要做的是找到一个矩阵m使得rm=r+t=[rx+tx,ry+ty,rz+tz]
然后你会发现你永远找不到这样的矩阵。
所以我们需要引入一个新的维度,原来的r=[rx,ry,rz,1]。然后我们可以找一个4X4的矩阵来实现平移。
在计算机图形学中,坐标变换通常不是单一的,一个几何体可能被设计成在每一帧中有多次平移、旋转、缩放等变化。我们通常通过级联各种子变化矩阵得到一个最终的变化矩阵,从而减少计算量。所以我们需要把翻译表达成一个变化矩阵。所以只能引入齐次坐标系。
关于齐次坐标的理解
我还没有完全理解对齐子坐标的概念,只看到大部分书都说“齐次坐标在仿射变换中非常方便”,然后就没有后记了。今天在一个叫“三百年重生”的博客上看到一篇关于透视投影变换讨论的文章,其中对齐子坐标有非常精辟的解释,尤其是对那句话:“齐次坐标表示是计算机图形学的重要手段之一,它不仅—— F.S. Hill,JR .
因为作者真的把对齐坐标解释的很好,我就原封不动的提取出来:
对于一个向量V和基oabc,我们可以找到一组坐标(v1,v2,v3)使得v = v1 a+v2 b+v3 c (1)。
对于一个点P,可以找到一组坐标(p1,p2,p3),这样P–O = P 1A+P2 B+P3 C(2)
从上面向量和点的表达式可以看出,为了在坐标系中表示一个点(如P),我们把点的位置看作是离这个基的原点O的位移,即向量-P-O(有的书把这样的向量叫做位置向量-从坐标原点开始的特殊向量),我们在表示这个向量的同时,把点P: P = O+P6用等价的方式表示。
(1)(3)是矢量和点在坐标系中的不同表达。可以看出,虽然矢量和点都是以代数分量的形式表示的,但是表示一个点比矢量需要更多的信息。如果我写一个代数分量表示(1,4,7),谁知道是向量还是点!
我们现在把(1)(3)写成一个矩阵:v = (v1 v2 v3 0) X (a b c o)。
P = (p1 p2 p3 1) X (a b c o),其中(a,b,c,o)是坐标基矩阵,右边的列向量分别是向量v和基下点p的坐标。这样,向量和点在相同的基下有不同的表达式:3D向量的第四代数分量是0,而3D点的第四代数分量是1。这种用四个代数分量表示3D几何概念的方式是齐次坐标表示。
这样,如果把上面的(1,4,7)写成(1,4,7,0),就是向量;如果是(1,4,7,1),则是一个点。以下是法线坐标和齐次坐标之间的转换:
如果(x,y,z)是一个点,就变成(x,y,z,1);
如果(x,y,z)是一个向量,它就变成(x,y,z,0)。
如果是(x,y,z,1),已知是一个点,变成(x,y,z);
如果是(x,y,z,0),我们知道它是一个向量,仍然变成(x,y,z)。
以上就是齐次坐标区分向量和点的方法。由此我们可以认为,对于最常见的三种仿射变换,平移T、旋转R和缩放S,平移变换只对点有意义,因为普通向量没有位置的概念,只有大小和方向。
旋转和缩放对于矢量和点都是有意义的,你可以用上面类似的同质表示来检测它们。可见齐次坐标对于仿射变换是非常方便的。
另外,对于一个普通坐标的点P=(Px,Py,Pz),有一个对应的齐次坐标族(wPx,wPy,wPz,w),其中w不等于零。比如P(1,4,7)的齐次坐标是(1,4,7,1),(2,8,14,2),(-0.1,-0.4,-0.4。所以,如果把一个点从普通坐标换成齐次坐标,把x,y,z,y,z乘以同一个非零数w,再加上第四个分量w;如果把齐次坐标转换成普通坐标,前三个坐标同时除以第四个坐标,然后去掉第四个分量。
齐次坐标用四个分量来表示3D概念,这样平移变换就可以用矩阵来进行,这样更便于进行仿射(线性)变换,正如小F.S. Hill所说。因为图形硬件已经普遍支持齐次坐标和矩阵乘法,所以推动了齐次坐标的使用,使它看起来像是图形中的一个标准。
这个设计很完美,保证了下图的计算仍然有意义:
上图中,在一个点上再加一个点,结果是两个点的结束,因为w=1+1=2。
现在,齐次坐标中的变换如下:
上图很好理解吧?(x,y,1)表示齐次坐标下的变量,通过左乘旋转45度,再通过左乘平移。