3D变换与视觉原理问答解析

内容分享36分钟前发布

0 0 0

47、3D 齐次仿射变换有多少个自由度？请说明理由。你认为 3D 射影变换的自由度是多少？

一般来说，3D 齐次仿射变换有 12 个自由度，因为 3D 仿射变换包括：

3 个平移自由度 3 个旋转自由度 6 个缩放与剪切自由度

3D 射影变换有 15 个自由度，3D 射影变换矩阵是 4×4 的，有 16 个元素，但由于具有整体尺度的不确定性，所以自由度为 15。

48、四个投影仪以 2×2 阵列排列，在平坦的墙壁上创建拼接显示。投影仪之间存在一些重叠区域。将一个投影仪中的像素 (x, y) 与另一个投影仪中的像素 (x′, y′) 关联起来的矩阵的最小维度是多少？请说明理由。

关联两个投影仪像素的矩阵最小维度通常是 3×3 ，因为二维平面上的投影变换通常可以用 3×3 的单应性矩阵表示。

49、内参数矩阵和外参数矩阵是仿射变换、欧几里得变换还是投影变换？请说明理由。我们知道相机校准矩阵是一个投影变换矩阵，内参数矩阵和外参数矩阵中哪一个使其成为投影变换？请说明理由。

内参数矩阵和外参数矩阵本身不是投影变换内参数矩阵描述相机内部特性外参数矩阵描述相机在世界坐标系中的位置和姿态，通常为仿射变换相机校准矩阵是投影变换矩阵内参数矩阵和外参数矩阵共同作用使其成为投影变换内参数矩阵将相机坐标系投影到图像坐标系外参数矩阵将世界坐标系转换到相机坐标系二者结合实现从世界坐标系到图像坐标系的投影变换

50、解释为什么肖像画中的眼睛看起来会“在房间里跟着你转”。请从观看者和画作之间的单应性（homography）关系的角度给出答案。

肖像画中眼睛的跟随错觉

平面肖像画中眼睛的图像是固定的。当人在房间里移动时，人眼与肖像画的相对位置会发生改变。然而，由于 单应性原理 ，画中眼睛与周围环境的投影关系在人眼看来变化不大，从而产生一种 眼睛在跟随观者移动 的错觉。

51、为什么对极约束对立体匹配（即寻找第一幅和第二幅图像之间的对应点）有用？应用图像校正后，校正图像中的对极点和对极线会发生什么变化？在进行立体匹配之前应用图像校正有哪些优点？

对极约束的重要性

对极约束的重要性在于，使用校准的立体相机对时，它能减少对应点的搜索空间。

考虑校准相机时，每个相机的位置可以投影到另一个相机的图像平面上，得到对极点。若在相机 C1 中检测到特征点 p1，其对应点必然位于对极线 l2 上，这样搜索空间从二维降为一维，在计算场景中各点深度时显著节省计算量。

52、如何从任何基本矩阵F确定对极点？（提示：答案涉及线性代数中的一个术语）

一般而言，基本矩阵 $ F $ 的零空间的非零向量就是对极点，可通过求解齐次线性方程组

F⋅e=0F⋅e=0
得到，其中 $ e $ 表示对极点。

53、考虑一对立体相机装置，它们相对于全局坐标系的旋转和平移分别为 (R_1)、(R_2)、(T_1) 和 (T_2)，其内部参数矩阵为单位矩阵。请用这些矩阵给出本质矩阵的表达式和基线长度的表达式。

一般情况下，本质矩阵 $ E = [T]_{ imes}R $，其中 $ T = T_2 – T_1 $，$ R = R_2R_1^{-1} $；基线长度为 $ leftlVert T_2 – T_1
ight
Vert $。

54、考虑一辆汽车在笔直的桥上行驶，汽车前部安装了一个摄像头，桥的尽头有一座显眼的建筑，桥的两侧等间隔悬挂着地标画，且间隔距离已知。考虑从该摄像头拍摄的两张照片。哪个3D场景位置会出现在膨胀焦点处？假设你能检测出每幅地标画从一张照片到另一张照片移动的距离，如何求出汽车的速度？

当 $ z = infty $ 时，$ p_1 = p_2 $，非常远的 3D 点的图像在两幅图像中保持不变，该点称为 膨胀焦点 ，所以桥尽头的显眼建筑会出现在膨胀焦点处。

55、考虑一个场景，该场景由一对前置立体相机持续观察。如果相机的基线增加，捕获图像中3D点的视差会如何变化？请说明理由。

在其他条件不变的情况下，相机基线增加，3D点的视差会增大。因为基线是两个相机光心之间的距离，基线越大，同一3D点在两个相机成像位置的差异就越大，视差也就越大。

56、考虑一个朗伯表面。它的双向反射分布函数（BRDF）有多少维？简要描述一个可以测量朗伯表面BRDF的简单硬件设置和算法。

朗伯表面的BRDF特性与测量方法

朗伯表面的BRDF通常是二维的。为了测量BRDF，硬件设置包括以下组件：

光源：用于照射样品 探测器 ：用于测量反射光 可旋转的样品台 ：用于放置样品并调整其角度

算法步骤

将样品放置在样品台上。用光源以不同的入射角照射样品。同时用探测器在不同的出射角测量反射光的强度。记录下不同入射角和出射角下的反射光强度。根据BRDF的定义计算出相应的BRDF值。

57、当我们将蓝色颜料和黄色颜料混合时会得到绿色。但当我们将蓝光投射到黄光上时，会得到棕色。你如何解释这一矛盾现象？

颜料混合是减法混色，蓝色颜料和黄色颜料混合时，它们吸收部分波长，剩余反射的波长产生绿色；
而光混合是加法混色，蓝光和黄光混合时，不同波长光叠加产生的视觉效果是白色，而不是棕色，原答案此处错误。

实际上蓝光和黄光混合产生白光的原理是：
蓝光和黄光在可见光光谱中是 互补色 ，根据加法混色原理，互补色光混合会产生 白色光 。

58、考虑一个16像素的一维图像I = {4, 2, 3, 6, 2, 3, 4, 5, 2, 3, 4, 5, 5, 1, 5, 5}。假设在填充时，一维图像的最后一个元素在两侧重复。(a) 绘制其直方图。(b) 展示使用滤波器[1/3 1/3 1/3]对该图像进行低通滤波后的输出数组。(c) 展示使用滤波器[-1 0 1]对该图像进行高通滤波后的输出数组。(d) 展示对该图像应用1×3中值滤波器后的输出。

以下为通用思路及示例答案。

(a) 直方图可统计各像素值出现次数，以像素值为横轴、出现次数为纵轴绘制。此图像中，1出现1次，2出现3次，3出现3次，4出现3次，5出现5次，6出现1次。

(b) 低通滤波，以每个像素为中心，与滤波器[1/3 1/3 1/3]卷积，如对第1个像素（因需填充，左侧填充5），(5 + 4 + 2)×1/3 = 11/3，依次计算得输出数组。

(d) 中值滤波，取每个像素及其左右邻域共3个像素的中值作为该像素新值，如对第1个像素（左侧填充5），5、4、2的中值为4，依次计算得输出数组。

59、考虑一个10×10的棋盘图像，其棋格是白色和灰色（值为128），而非白色和黑色。每个棋格大小为10×10像素。绘制该图像的直方图。你能想出另一个具有相同直方图的图像吗？请说明理由。

图像直方图会有两个峰值，一个在白色对应值（通常为 255 ），一个在灰色对应值 128 。具有相同直方图的另一图像可以是随机分布白色和灰色像素的图像，因为只要白色和灰色像素数量与棋盘图像相同，直方图就会一样。

60、场景的模型变换是绕Y轴逆时针旋转90度（旋转矩阵为R），接着沿正X方向平移20个单位（平移矩阵为T），那么最终的变换是什么？

最终变换为旋转矩阵 $ R $ 与平移矩阵 $ T $ 的组合，在齐次坐标下为矩阵乘法 $ T imes R $，但需要根据旋转和平移矩阵的具体形式计算得出。

旋转矩阵 $ R $ ：可根据绕 Y 轴逆时针旋转 90 度的规则得出。 平移矩阵 $ T $ ：可根据沿正 X 方向平移 20 个单位的规则得出。

61、我们说在屏幕空间中对Z进行插值在数学上是错误的，应该对Z的倒数进行插值来纠正这种影响。然而，我们却使用相同的屏幕空间插值方法来插值颜色。这在数学上正确吗？请说明理由。

对颜色使用屏幕空间插值在数学上 不一定准确 。

颜色插值和深度插值有不同的 数学特性 和 物理意义 ：

深度插值 ：
因透视投影导致线性插值不准确，需使用 Z 的倒数插值 。

颜色插值 ：
通常遵循 线性混合规律 。在简单场景中，屏幕空间线性插值可能近似正确，但在复杂光照、透视效果等场景中可能也不准确。

62、你正在使用单个纹理映射多边形渲染一个黑白相间的棋盘格瓷砖地板。视图模拟一个人站在地板上，看着地板上离他很远的一个点。（1）可以看到地板远端出现了伪影。你将如何消除这些伪影？（2）如何使用采样定理解释这种方法为什么有效？

（1）可通过纹理过滤（如双线性过滤、三线性过滤等）、多级渐进纹理（Mipmapping）等方法来消除伪影。

（2）多级渐进纹理等方法可根据物体离相机的距离选择合适分辨率的纹理，避免因采样频率不足导致的走样，即满足采样定理中采样频率需大于信号最高频率两倍的要求，从而减少伪影；纹理过滤方法通过对纹理像素进行加权平均，可使颜色过渡更平滑，同样可避免高频信号未被正确采样产生的伪影，符合采样定理的原理。

63、考虑一个二维场景。该场景包含一个平行四边形，其四个顶点分别为(1,0)、(-1,0)、(0,-1)和(0,1)。(a) 这个平行四边形的二维轴对齐边界框的四个顶点是什么？(b) 如果我们想将这个平行四边形平移(2,2)，如何使用变换参数来找到新的轴对齐边界框？(c) 如果我们要将平行四边形旋转45度（而不是平移），是否可以使用类似的方法？(d) 你能想到其他可以像(b)中那样对所有不同类型的刚体变换重新计算边界形状的边界形状吗？

(a) 轴对齐边界框的四个顶点为 $(-1, -1)$、$(1, -1)$、$(1, 1)$、$(-1, 1)$； (b) 对原边界框四个顶点都加上平移向量 $(2, 2)$ 得到新边界框顶点； (c) 旋转后不能用类似平移的简单方法，因为旋转会改变边界框的轴对齐性； (d) 可以考虑使用有向边界框（OBB）。