三维变换与投影几何问题解析

table {
border-collapse: collapse;
width: 100%;
margin-bottom: 1rem;
}
th, td {
border: 1px solid #ddd;
padding: 8px;
text-align: left;
}
th {
background-color: #f2f2f2;
}
tr:nth-child(even) {
background-color: #f9f9f9;
}
pre {
background-color: #f8f8f8;
padding: 15px;
border-radius: 4px;
overflow-x: auto;
}

45、三维齐次仿射变换有多少个自由度?请说明理由。你认为三维投影变换的自由度是多少?

一般来说,3D齐次仿射变换的自由度是12,因为它包含:

3个平移参数、

3个旋转参数、

6个缩放与剪切参数;

而3D投影变换的自由度是15。

46、在三维空间中,证明 Rz(θ1)Rz(θ2) = Rz(θ2)Rz(θ1)。这说明了绕坐标轴旋转的什么性质?证明 Rz(θ1 + θ2) = Rz(θ1)Rz(θ2)。利用这个性质证明绕任意轴(记为 Ra)的旋转也遵循该性质,即 Ra(θ1 + θ2) = Ra(θ1)Ra(θ2) = Ra(θ2)Ra(θ1)。

对于 $ R_z( heta_1)R_z( heta_2) = R_z( heta_2)R_z( heta_1) $,说明绕同一坐标轴的旋转是可交换的。

证明 $ R_z( heta_1 + heta_2) = R_z( heta_1)R_z( heta_2) $ 可通过矩阵乘法展开验证。

对于任意轴 $ R_a $ 的情况,可先将任意轴旋转转化为绕坐标轴的旋转组合,再利用已证性质进行推导。

47、四个投影仪以2×2阵列排列,在平坦的墙壁上创建拼接显示。投影仪之间存在一些重叠区域。将一个投影仪中的像素 (x, y) 与另一个投影仪中的像素 (x′, y′) 关联起来的矩阵的最小维度是多少?请说明理由。

关联两个投影仪像素的变换通常是二维投影变换,需要一个3×3的齐次变换矩阵,其最小维度为3×3。

48、解释为什么肖像画中的眼睛看起来会“在房间里跟着你转”。请从观看者和画作之间的单应性(homography)关系的角度给出答案。

肖像画中眼睛跟随的原理

肖像画是二维平面图像,眼睛部分的光影和线条等特征已固定。

当观看者移动时,画中眼睛反射的光线仍以固定方式进入观看者眼中,使得观看者感觉眼睛在跟随自己。


单应性

是描述两个平面之间的投影变换关系,在此现象中,可理解为:

观看者不同位置看到的画面是通过单应性变换相关联的

画中眼睛相对于周围环境的投影关系不变

因此产生眼睛跟随的错觉。

49、为什么对极约束对于立体匹配(即寻找第一幅和第二幅图像之间的对应点)很有用?应用图像校正后,校正图像中的对极点和对极线会发生什么变化?在进行立体匹配之前应用图像校正有什么优点?

对极约束的重要性

对极约束的重要性在于,使用校准的立体相机对时,它能减少对应点的搜索空间。

由于使用校准相机,每个相机的位置可投影到另一个相机的图像平面,得到对极点。

若在相机C1中检测到特征点p1,其对应点必然位于对极线e2p2 = l2上,因此搜索空间从二维降至一维,在计算场景点深度时可显著节省计算量。

50、如何从任何基本矩阵F确定对极点?(提示:答案涉及线性代数中的一个术语)

基本矩阵 $ F $ 的零空间(null space)中的非零向量即为对极点,可通过求解齐次线性方程组

F⋅e=0F⋅e=0

(其中 $ e $ 为对极点向量)得到。

51、考虑一对立体相机装置,它们相对于全局坐标系的旋转和平移分别为 (R_1)、(R_2)、(T_1) 和 (T_2)。它们的内参矩阵为单位矩阵。请用这些矩阵给出本质矩阵的表达式和基线长度的表达式。

对于本质矩阵,由于内参矩阵为单位矩阵,可将两相机转化为 $ C_1 $ 与世界坐标轴对齐,$ C_2 $ 相对于 $ C_1 $ 平移 $ T $、旋转 $ R $ 的情况。

其中:

– $ T = T_2 – T_1 $

– $ R = R_2 cdot R_1^{-1} $

本质矩阵 $ E $ 的表达式为:

E=[T]×RE=[T]×R

基线长度为两相机光心之间的距离,即:

|T2−T1||T2−T1|

52、考虑一个场景,该场景由一对前置立体相机持续观察。如果相机的基线增加,那么在捕获的图像中,三维点的视差会如何变化?请说明理由。

基线增加时,相同三维点在两个相机图像中的位置差异会增大,因此视差会增大。

53、考虑一个朗伯表面。它的双向反射分布函数(BRDF)有多少维?简要描述一个可以测量朗伯表面BRDF的简单硬件设置和算法。

朗伯表面的BRDF是各向同性的,仅与入射光和表面法线的夹角有关,所以是2维的。

简单硬件设置可包括:

一个光源

一个可旋转的样品台(用于放置朗伯表面样品)

一个探测器

算法步骤为:

将样品放置在样品台上

固定光源位置

旋转样品台,改变入射光与表面法线的夹角

探测器在不同角度测量反射光强

根据反射光强和入射光强计算不同角度下的BRDF值

54、考虑一个16像素的一维图像I = {4, 2, 3, 6, 2, 3, 4, 5, 2, 3, 4, 5, 5, 1, 5, 5}。假设在填充时,一维图像的最后一个元素在两侧重复。(a) 绘制其直方图。(b) 展示使用滤波器[1/3 1/3 1/3]对该图像进行低通滤波后的输出数组。(c) 展示使用滤波器[-1 0 1]对该图像进行高通滤波后的输出数组。(d) 展示对该图像应用1×3中值滤波器后的输出结果。

以下为各部分的大致解答思路:

(a) 直方图是统计图像中每个像素值出现的频次,需统计 I 中每个值出现的次数并绘制直方图。

(b) 低通滤波时,使用 [1/3 1/3 1/3] 滤波器对图像进行卷积,填充时重复最后一个元素,按卷积规则计算每个位置的输出值。

(c) 高通滤波使用 [-1 0 1] 滤波器进行卷积,同样进行填充后计算输出数组。

(d) 中值滤波,对每个 1×3 窗口内的元素排序取中值作为该位置的输出值。

55、考虑一个10×10的棋盘图像,其棋盘格是白色和灰色(值为128),而非白色和黑色。每个棋盘格大小为10×10像素。画出该图像的直方图。你能想出另一个具有相同直方图的图像吗?请说明理由。

直方图分析说明

对于该棋盘图像,直方图会有两个峰值:

一个在灰度值为

128

处,代表灰色棋盘格;

另一个在灰度值为

255

处(假设白色为255),代表白色棋盘格。

可能具有相同直方图的图像

可能具有相同直方图的图像包括:

随机分布的白色和灰色方块组成的图像。


前提条件

:只要白色和灰色方块的像素数量与棋盘图像中白色和灰色的像素数量相同,其直方图就会相同。

原因说明

直方图描述的是图像中不同灰度值的像素数量分布情况。只要不同灰度值的像素数量一致,直方图就相同。

56、考虑一个位于 XY 平面的二维正方形,边长为 2 个单位,中心在原点,四条边平行或垂直于坐标轴。(a) 绘制该正方形经过以下一系列操作后的变换图形:绕 Z 轴逆时针旋转 45 度,沿(√2, 0, 0)平移,再绕 Z 轴逆时针旋转 45 度。能否简化这些变换,给出新的变换序列以达到相同结果?(b) 绘制该正方形经过以下一系列操作后的变换图形:沿(2, 2, 0)平移,按(3, 2, 1)进行缩放。(c) 绘制上一个问题中两个操作顺序交换后正方形的图形。(d) 我们希望通过先平移后缩放的方式达到上一个问题中先缩放后平移的变换结果。平移和缩放的参数将如何改变?

对于(a),可通过矩阵乘法简化变换序列;

对于(b)和(c),分别按给定顺序进行平移和缩放操作后绘制图形;

对于(d),设原平移向量为(tx, ty, tz),缩放因子为(sx, sy, sz),新平移向量为(tx/sx, ty/sy, tz/sz),新缩放因子不变仍为(sx, sy, sz)。

57、我们说在屏幕空间对Z进行插值在数学上是错误的,我们应该对Z的倒数进行插值以纠正这种影响。然而,我们使用相同的屏幕空间插值来插值颜色。这在数学上是否正确?请说明理由。

颜色插值与深度(Z值)插值的区别

颜色插值和深度(Z值)插值的原理和目的不同。

深度插值

深度插值需要考虑

透视投影的影响

直接对Z值进行插值会产生误差。

因此,应采用对

Z的倒数进行插值

的方法。

颜色插值

颜色插值通常假设颜色在

屏幕空间是线性变化的

在不考虑复杂光照和材质的情况下,使用屏幕空间线性插值在数学上是合理的。

然而,在复杂场景中,这种方法

可能也会出现不准确的情况

© 版权声明

相关文章

暂无评论

none
暂无评论...