第七节：计算机视觉--相机

图像形成
从3D到2D
- 投影的性质
图像的坐标系
像素的内参数和外参数
失真

在上一节，我们已经知道如何得到两个图像之间的转换关系，之后，我们就可以将两个图像进行拼装了。但是在了解图像的拼装之前，我们还需要了解一下图像形成的原理。

在现实世界中，物体是三维的，我们需要将一个三维的物体映射到一个二维的图像平面上。我们就必须了解一下相机的成像原理

图像形成

我们在此处只是讨论小孔成像，实际上透镜成像和小孔成像的基本相似。

我们知道，光线穿过小孔其传播方向是不发生改变的，所以，当现实世界的物体的光线透过小孔时，将产生一个反转的图像。

假如我们在小孔后方加一个成像平面，那么物体就会从一个三维变成一个二维图像。

从3D到2D

当三维物体的光线穿过小孔投影到投影平面PP时，我们需要将原本在相机坐标系上的点投影到像平面坐标系。我们假设三维世界有一个点，经过小孔后其坐标是为(x, y, z), 现在要将其投影到投影平面上。

这个过程就是计算(x, y, z)到COP的直线与PP的交点，所以我们可以使用相似三角形。并将Z坐标丢掉，就得到了成像平面上的点。其中原点在成像平面PP的中心。（z为负半轴） $(x, y, z) \rightarrow (-d{\frac{x}{z}}, -d{\frac{y}{z}},-d) \rightarrow (-d{\frac{x}{z}}, -d{\frac{y}{z}})$

这不是一个线性变化，并不利于计算，所以，我们将其改为齐次坐标：

关于齐次坐标到原坐标的变换，我们只需要

此时，我们就可以提供一个矩阵计算由3D齐次坐标变成2D齐次坐标了。

这就是透视投影，其中矩阵被称为投影矩阵，需要注意的是投影矩阵的尺度对变换无影响。

投影的性质

很明显，我当们将物体从3D降维到2D时，我们一定是失去了角度和距离。但是仍有一些属性保留了下来

多对一：同一光线上的所有点映射到图像中的同一点
点->点
线->线(保持共线性): 但是通过焦点的线变成一个点
平面->平面：但是通过焦点的平面变成一条线
平行线在消失点汇合：每个方向在空间都有他的消失点，但平行与图像平面的平行线保持平行

图像的坐标系

在成像过程中，我们一共需要四个坐标系，即

世界坐标系：即自然坐标系
相机坐标系：以相机的关心为原点，Z轴指向相机前方，x轴向右，y轴向上
像平面坐标系：即物体成像平面，通常是距光心一倍焦距的平面上，原点在中心
像素平面坐标系：像素平面坐标系的原点位于左上角，u轴向右与x轴平行，v轴向下与y轴平行。

在转换的过程中，我们是使用齐次坐标的

第一步：将世界坐标系向相机坐标系转换

由于我们的相机坐标系和世界坐标系的原点不同，而我们在上述的转换过程中，(x, y, z)这一点的坐标是在相机坐标系下的，所以我们在进行3D到2D降维的过程就需要将世界坐标系向相机坐标系转换。

在转换的过程中，我们需要知道相机的位置和相机的方向(世界坐标系下)。例如，当前的世界坐标系和相机坐标系如图：

我们就需要进行平移和旋转两个步骤，只有这样才可以使相机坐标系为Z轴指向相机前方，X轴向右， Y轴向左。

首先进行平移，其平移矩阵为：

然后我们就将世界坐标系原点放在了相机坐标系原点了。

之后，我们在进行一次旋转即可将相机规范化.

其旋转矩阵为，需要额外增加一行和一列[0 0 0 1]用来表示旋转矩阵：

此时相机坐标系和世界坐标系为：

经过相机坐标系和世界坐标系的转换，我们就可以将3D的点映射到2D平面了。

第二步：相机坐标系向平面坐标转换

我们首先在光心前做一个PP投影平面，将现实坐标系中的点投影到PP中

只是在此时我们将d置为1，也就是说此时的投影矩阵为：

即$[x/z, y/z, 1]^T = P * [X, Y, Z, 1]^T$

疑问：为什么此时的x,y坐标的正负与Z坐标有关？难道是投影到Z正半轴，然后投影回来吗，这样会保证最终获得的图片与现实坐标的是一致的。所以说也许PP投影面是在cop正半轴？

再之后，我们将这个PP平面映射到成像平面中，由于成像平面中的点与PP平面的点相连经过原点，仍然使用相似三角形就可以得到最终平面的位置：

第三步：像面坐标系向像素坐标系的转换

我们知道在像素坐标系中，我们的原点在左上角，而像面坐标系，其原点在中心，所以要进行转换，首先要将原点转到左上角。即：
\[\left\{\begin{matrix} u = x + c_{x} & \\ v = y + c_{y} & \end{matrix}\right.\]
由于在计算机中，图片是由一个个像素组成的，其像素是矩形的，设其其长和宽分别时$\alpha$和$\beta$。设像素坐标为$(u, v, 1)^{T}$。所以我们的坐标转换为：
\[\left\{\begin{matrix} u =\alpha x + c_{x} & \\ v = \beta y + c_{y} & \end{matrix}\right.\]
由于工艺的问题，我们甚至还存在倾斜因子s，这个实在无法理解，就先放放。

经此整合，我们就可以得到，从像面坐标系到像素坐标系的过程矩阵为：

\[\begin{bmatrix} u\\ v\\ 1 \end{bmatrix} =\begin{bmatrix} \alpha & 0 & c_{x}\\ 0 & \beta & c_{y}\\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} x\\ y\\ 1 \end{bmatrix}\]

总结：

对与上述的三个步骤，我们完整的将一个3D物体投影到像素平面上。

经过总结，其矩阵为

我们将前两个合并就构成了相机的内参数(注意：没有加入倾斜度)

\[\begin{bmatrix} u\\ v\\ 1 \end{bmatrix} =\begin{bmatrix} -f\alpha & 0 & c_{x}\\ 0 & -f\beta & c_{y}\\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} 1 & 0 & 0 &0\\ 0 & 1 & 0 &0\\ 0 & 0 & 1 &0 \end{bmatrix}\begin{bmatrix}R_{3×3} & O_{3×1}\\O_{1×3}&1\end{bmatrix}\begin{bmatrix}I_{3×3} & T_{3×1}\\O_{1×3}&1\end{bmatrix}\begin{bmatrix} x\\ y\\ z \\ 1 \end{bmatrix}\]

像素的内参数和外参数

在上述的过程中，其中K是内参数，一般而阳，$\alpha， \beta$均为1

\[K =\begin{bmatrix} -f\alpha & 0 & c_{x}\\ 0 & -f\beta & c_{y}\\ 0 & 0 & 1 \end{bmatrix}\]

平移矩阵和旋转矩阵是外参数。

所以最后的投影矩阵就成了