table {
border-collapse: collapse;
width: 100%;
margin-bottom: 1rem;
}
th, td {
border: 1px solid #ddd;
padding: 8px;
text-align: left;
}
th {
background-color: #f2f2f2;
}
tr:nth-child(even) {
background-color: #f9f9f9;
}
pre {
background-color: #f8f8f8;
padding: 15px;
border-radius: 4px;
overflow-x: auto;
}
41、计算以下信号的卷积(答案以方程形式给出)。a. h[t] = δ[t – 1] + δ[t + 1],x[t] = δ[t – a] + δ[t + b];b. h[t] = δ[t + 2],x[t] = e^t;c. h[t] = e^(-t),x[t] = δ[t – 2];d. h[t] = δ[t] – δ[t – 1],x[t] = e^(-t)。
对于a:
x[t]∗h[t]=(δ[t−a]+δ[t+b])∗(δ[t−1]+δ[t+1])=δ[t−a−1]+δ[t−a+1]+δ[t+b−1]+δ[t+b+1]x[t]∗h[t]=(δ[t−a]+δ[t+b])∗(δ[t−1]+δ[t+1])=δ[t−a−1]+δ[t−a+1]+δ[t+b−1]+δ[t+b+1]
对于b:
x[t]∗h[t]=et∗δ[t+2]=et+2x[t]∗h[t]=et∗δ[t+2]=et+2
对于c:
x[t]∗h[t]=e−t∗δ[t−2]=e−(t−2)x[t]∗h[t]=e−t∗δ[t−2]=e−(t−2)
对于d:
x[t]∗h[t]=e−t∗(δ[t]−δ[t−1])=e−t−e−(t−1)x[t]∗h[t]=e−t∗(δ[t]−δ[t−1])=e−t−e−(t−1)
42、g[t] 是一个一维离散信号,定义在 -3 ≤ t ≤ 4 范围内。线性系统的脉冲响应 h[t] 是另一个离散信号,定义在 2 ≤ t ≤ 6 范围内。g[t] 通过该系统的响应由 g[t] 与 h[t] 的卷积给出,并记为 y[t]。y[t] 的长度是多少?y[t] 生成时 t 的取值范围是多少?输入 g[t] 完全包含在输出 y[t] 中时 t 的取值范围是多少?
若信号长度为 $ n $,脉冲响应支持长度为 $ m $,则卷积结果长度为 $ n + m – 1 $。
$ g[t] $ 长度 $ n = 4 – (-3) + 1 = 8 $
$ h[t] $ 长度 $ m = 6 – 2 + 1 = 5 $
所以 $ y[t] $ 长度为 $ 8 + 5 – 1 = 12 $。
$ t $ 取值范围:
$ g[t] $ 范围:$ -3 leq t leq 4 $
$ h[t] $ 范围:$ 2 leq t leq 6 $
卷积后 $ t $ 范围为:
−3+2≤t≤4+6⇒−1≤t≤10−3+2≤t≤4+6⇒−1≤t≤10
完全包含范围:
完全浸入样本数量为 $ n – m + 1 = 8 – 5 + 1 = 4 $,从 $ t = 2 $ 开始有 4 个,所以范围是:
2≤t≤52≤t≤5
43、设计一个用于使图像产生重影的三像素一维核,其中重影出现在图像右侧两个像素处,且强度为图像的一半。将此概念扩展,设计一个二维滤波器,使重影在水平和垂直方向上以相同方式出现。
一维核可以设计为
[1, 0, 0.5]
,表示原图像像素、间隔像素、重影像素的权重。二维滤波器可以设计为一个3×3的矩阵,中心为1代表原图像素,水平和垂直方向偏移两个像素处为0.5代表重影像素,其余为0,即
水平重影方向:
[[0, 0, 0],
[0, 1, 0],
[0, 0, 0.5]]
垂直重影方向:
[[0, 0, 0],
[0, 1, 0],
[0.5, 0, 0]]
或者合并为一个综合的3×3矩阵:
[[0, 0, 0.5],
[0, 1, 0],
[0.5, 0, 0]]
44、你需要增强图像的边缘。如何使用高斯金字塔在多个尺度上实现这一操作?能否设计一个单一滤波器应用于金字塔的每一层来实现相同效果?
使用高斯金字塔在多尺度上增强图像边缘:
构建高斯金字塔。
对每一层进行低通滤波以去除高频噪声。
对滤波后的每层图像进行边缘检测。
由于不同尺度下图像特征不同,难以设计一个单一滤波器应用于金字塔每一层来实现相同的边缘增强效果。
45、给定图像的拉普拉斯金字塔,如何重建原始图像?
要从拉普拉斯金字塔重建原始图像,可通过将拉普拉斯金字塔的各层图像相加来实现。具体而言:
从最高层开始,
将每层拉普拉斯图像与上一层经过上采样后的图像相加,
逐层向下操作,
最终得到原始图像。
46、考虑由一对立体相机(两个相机放置得彼此靠近,就像人的两只眼睛)拍摄的两张图像。我们已经在第一张图像中标记了一些特征。请提供一种方法来准确找到这些特征在第二张图像中的位置。
通常可以采用特征匹配算法,如
SIFT
(尺度不变特征变换)、
SURF
(加速稳健特征)、
ORB
(Oriented FAST and Rotated BRIEF)等,先在两张图像中提取特征点,然后通过特征描述符进行匹配,从而找到第一张图像中标记特征在第二张图像中的对应位置。
47、考虑一个长度为16的一维信号x,其中样本i对应的信号值由x [ i ] = 2 * sin(π * i / 4) + 3 * cos(π * i / 2) + 4 * cos(π * i) + 5给出。写出数组x_c和x_s,其中x_c[k] = ∑(i = 0到N – 1) x [ i ] * cos(2 * π * k * i / N),x_s[k] = ∑(i = 0到N – 1) x [ i ] * sin(2 * π * k * i / N) ,N = 16。
已知
xc[k]=∑i=0N−1x[i]⋅cos(2πkiN)xc[k]=∑i=0N−1x[i]⋅cos(2πkiN)
xs[k]=∑i=0N−1x[i]⋅sin(2πkiN)xs[k]=∑i=0N−1x[i]⋅sin(2πkiN)
这里 $ N = 16 $,
x[i]=2⋅sin(πi4)+3⋅cos(πi2)+4⋅cos(πi)+5x[i]=2⋅sin(πi4)+3⋅cos(πi2)+4⋅cos(πi)+5
计算可得:
xc=[80,0,48,0,48,0,0,0,64]xc=[80,0,48,0,48,0,0,0,64]
xs=[0,32,0,0,0,0,0,0,0]xs=[0,32,0,0,0,0,0,0,0]
48、考虑空间域中用于低通滤波的盒式滤波器。它的频域响应是什么?
与三像素滤波器卷积会阻挡高于 $ f_1 $ 的所有频率,与五像素滤波器卷积会阻挡高于 $ f_2 $($ f_2 < f_1 $)的所有频率,且不同频率被不同程度衰减,通过的较高频率衰减更严重。
49、考虑用于低通滤波的空间域盒式滤波器。空间域高斯滤波器的频域响应是什么?
空间域高斯滤波器的频域响应仍是高斯函数。
50、考虑用于低通滤波器的空间域盒式滤波器。在空间域中高斯函数与 sinc 函数的乘积被认为是一种理想的低通滤波器。请解析地表示出该滤波器的频域响应。
根据傅里叶变换的性质,空间域中两个函数相乘,其频域响应是这两个函数频域响应的卷积。
已知高斯函数的傅里叶变换仍是高斯函数,
sinc 函数对应频域的盒式函数,
所以该滤波器频域响应是高斯函数与盒式函数的卷积。
51、一张高飞的图片(a)仅在水平方向进行了平滑处理,得到图片(b)。现有(c)和(d)两个幅度响应,其中一个属于(a),另一个属于(b)。请进行匹配并说明理由。
一般来说,平滑处理会减少图像的高频信息。若图(c)中高频成分多,图(d)中高频成分少,那么图(c)可能属于图(a),图(d)可能属于图(b),因为平滑后的图像(图b)高频信息减少。
52、如何去除图像中条形物的阴影?
可尝试使用图像编辑软件中的阴影去除工具、调整图像的亮度和对比度、进行直方图均衡化或自适应直方图拉伸等方法,也可利用深度学习算法进行阴影检测和去除。
53、你想检测图像中的边缘。你可以使用基于曲率的方法C或基于梯度的方法G。a. 使用方法C需要进行单次还是多次卷积操作?请说明理由。b. 使用方法G需要进行单次还是多次卷积操作?请说明理由。c. 边缘检测滤波器通常将低通滤波器与曲率或梯度滤波器结合使用。为什么?d. 这个低通滤波器的宽度如何影响你检测到的边缘的分辨率?
a. 推测可能需多次,因为要计算二阶导数或曲率,可能涉及多次卷积计算像素间关系。
b. 通常需多次,因要计算图像在不同方向上的梯度。
c. 结合低通滤波器可平滑图像、去除噪声,避免噪声产生虚假边缘,使曲率或梯度滤波器更好检测真实边缘。
d. 低通滤波器宽度越大,平滑效果越强,细节丢失越多,边缘分辨率越低;宽度越小,平滑效果弱,保留更多细节,边缘分辨率相对较高。
54、考虑Harris角点检测器,其中M(x, y)是像素(x, y)处的海森矩阵。a. 当M(x, y)的最大特征值远大于最小特征值时,位置(x, y)处的像素是角点吗?请说明理由。b. M(x, y)的所有特征值都是正数吗?你上面指定的选择角点的标准对负特征值是否适用?
a. 不是。只有当两个特征值都很大时,才能在 $(x, y)$ 处检测到角点;若其中一个特征值有较大幅值,则在 $(x, y)$ 处存在边缘。所以当最大特征值远大于最小特征值时,不满足两个特征值都大的条件,该像素不是角点。
b. 由于角点检测标准是两个特征值都大,对于负特征值,绝对值大也可认为是特征值大,所以该标准在考虑特征值绝对值的情况下对负特征值适用。
55、从卷积的性质解释为什么 f 与 ∂h/∂x 的卷积等于 ∂f/∂x 与 h 的卷积。
根据卷积的性质,卷积运算满足交换律、结合律和分配律,同时在满足一定条件下,卷积和求导运算可以交换顺序。
对于 $ f $ 与 $ frac{partial h}{partial x} $ 的卷积,根据卷积和求导运算交换顺序的性质,有:
f∗(∂h∂x)=∂(f∗h)∂xf∗(∂h∂x)=∂(f∗h)∂x
同理,
(∂f∂x)∗h=∂(f∗h)∂x(∂f∂x)∗h=∂(f∗h)∂x
所以:
f∗(∂h∂x)=(∂f∂x)∗hf∗(∂h∂x)=(∂f∂x)∗h
56、考虑一个正方形ABCD,给出一个矩阵或矩阵的乘积,它能将正方形ABCD变换为正方形ABCD。展示如果将相同的变换应用于正方形ABCD会发生什么。
能将正方形ABCD变换为自身的矩阵是单位矩阵。
若用单位矩阵对正方形ABCD进行变换,正方形ABCD不会发生任何变化,即保持原状。
57、考虑一个二维矩形ABCD,其中A = (0, 0),B = (2, 0),C = (2, 1),D = (0, 1)。我们想对这个矩形应用一个二维变换,使其变为平行四边形ABEF,其中E = (4, 1),F = (2, 1)。a. 这是哪种变换?实现此变换的3×3矩阵M是什么?c. 要将ABEF变换为平行四边形A’B’E’F’,其中A’ = (1, 2),B’ = (3, 2),E’ = (5, 3),F’ = (3, 3),我们需要应用什么额外的变换N?d. 用M和N表示的将ABCD变换为A’B’E’F’的最终级联矩阵是什么?
a. 此变换为剪切变换。设矩阵M为
$$
egin{bmatrix}
1 & a & 0 \
0 & 1 & 0 \
0 & 0 & 1
end{bmatrix}
$$
将点(2, 1)变换为(4, 1),可得
$$
2 + a imes 1 = 4
$$
解得a = 2,所以
$$
M = egin{bmatrix}
1 & 2 & 0 \
0 & 1 & 0 \
0 & 0 & 1
end{bmatrix}
$$
c. 额外变换N为平移变换,平移向量为(1, 2),矩阵N =
$$
egin{bmatrix}
1 & 0 & 1 \
0 & 1 & 2 \
0 & 0 & 1
end{bmatrix}
$$
d. 最终级联矩阵为N×M =
$$
egin{bmatrix}
1 & 2 & 3 \
0 & 1 & 2 \
0 & 0 & 1
end{bmatrix}
$$
58、推导一个物体沿以点(5, 5, 5)为起点、向量u = (1, 2, 1)所指定的任意方向按比例因子3进行缩放的缩放矩阵。
推导该缩放矩阵可按以下步骤进行:
平移物体使指定点 (5, 5, 5) 移到原点;
找到一个旋转矩阵将向量 u 旋转到某个坐标轴(如 z 轴);
沿该坐标轴进行缩放;
进行反向旋转;
进行反向平移将物体移回原位置。
最终缩放矩阵是这些变换矩阵的连乘。
59、在 XY 平面中,有一个房子图形,Z 轴垂直于页面向外。绘制在局部坐标系中进行以下变换后的房子:沿 X 轴正方向平移 1 个单位,绕 Z 轴逆时针旋转 90 度,沿 Y 轴正方向平移 2 个单位。
需根据图形变换的相关知识,先对房子的各个顶点进行平移(T(1, 0, 0))、旋转(Rz(90))、再平移(T(0, 2, 0))操作,然后根据变换后的顶点位置绘制房子。
60、3D 齐次仿射变换有多少个自由度?请说明理由。你认为 3D 投影变换的自由度是多少?
变换的自由度分析
3D 仿射变换
使用
4×4 矩阵
表示
可以自由改变其中的
12 个参数
仍处于仿射变换子空间
因此,
3D 齐次仿射变换具有 12 个自由度
3D 投影变换
同样使用
4×4 齐次变换矩阵
表示
由于矩阵的
齐次性
特性
可将矩阵中的一个元素固定为 1
因此,独立参数个数为
16 – 1 = 15
所以,
3D 投影变换具有 15 个自由度
61、为什么对极约束对立体匹配(即寻找第一幅和第二幅图像之间的对应点)有用?应用图像校正后,校正图像中的对极点和对极线会发生什么变化?在进行立体匹配之前应用图像校正有哪些优点?
对极约束在立体匹配中的作用
对极约束对立体匹配有用,是因为当使用校准的立体相机对时,它减少了对应点的搜索空间。
应用图像校正后,校正图像中的对极线会变成水平直线且相互平行,对极点会位于无穷远处。
在进行立体匹配之前应用图像校正的优点包括:
简化了匹配算法,因为对应点只需在同一水平线上搜索,减少了计算量;
提高了匹配的准确性和效率,降低了误匹配的概率。
62、如何从任何基本矩阵F确定极点?(提示:答案涉及线性代数中的一个术语)
一般而言,基本矩阵 $ F $ 的零空间(null space)对应的非零向量可确定极点。因为对于基本矩阵 $ F $,极点 $ e $ 满足
Fe=0Fe=0
求解此齐次线性方程组的非零解,即 $ F $ 的零空间,便可得到极点。
63、考虑一对相机立体装置,它们相对于全局坐标系的旋转和平移分别为R₁、R₂、T₁和T₂。它们的内参矩阵为单位矩阵。请用这些矩阵给出本质矩阵和基线长度的表达式。
本质矩阵 $ E = [T]_{ imes}R $,其中
– $ T = T_2 – T_1 $
– $ R = R_2 R_1^{-1} $
基线长度为 $ ||T_2 – T_1|| $。
64、考虑一个场景被一对前置立体相机持续观察。如果相机的基线增加,捕获图像中3D点的视差会如何变化?请说明理由。
基线增加,3D点的视差会增大。
因为基线增大,左右相机观察同一3D点的视角差异变大,导致该点在左右图像中的位置差异(即视差)增大。
65、考虑一个朗伯表面。它的双向反射分布函数(BRDF)有多少维?简要描述一种可以测量朗伯表面BRDF的简单硬件设置和算法。
朗伯表面的BRDF特性及测量方法
BRDF维度
朗伯表面的BRDF是四维的
硬件设置
一个可控光源:用于提供不同方向的入射光
一个可在半球空间内移动的探测器:用于测量反射光
测量算法
在不同的入射方向和观测方向组合下进行测量
分别测量:
– 入射光的辐照度
– 反射光的辐射率
根据BRDF定义进行计算:
– BRDF = 反射辐射率 / 入射辐照度
得到每个方向组合下的BRDF值
66、当你在教室里打开投影仪时,发现它主要投射出黑色和紫色。你判断连接原色R、G和B的电线可能有一根出故障了。是哪一根,为什么?
可能是连接绿色(G)电线故障。
因为紫色由红(R)和蓝(B)混合而成,若绿色电线故障无绿光输出,投影画面就会以黑和紫色为主。
67、C₂的主波长是多少?
需连接白色点W和C₂,并将直线向后延伸与色度图边缘相交于一点,该点颜色对应的波长即为C₂的主波长;
若延伸线落在无波长对应的非光谱边界部分(如紫色),则主波长未定义,此时连接W到C₂并向后延伸得到的是互补波长。
68、当我们将蓝色颜料和黄色颜料混合时会得到绿色。但当我们将蓝光投射到黄光上时,会得到棕色。如何解释这种矛盾现象?
颜料混合是减色混合,蓝色颜料和黄色颜料混合时,它们吸收部分波长,剩余反射的波长产生绿色;而光混合是加色混合,蓝光和黄光混合时,不同波长叠加,产生的颜色是白色,而非棕色,题目中关于光混合结果的描述有误。
69、考虑一个具有线性伽马函数的灰度图像。你会如何改变伽马函数以使图像具有更高的对比度?
一般而言,可通过调整伽马值来改变对比度。若伽马值小于1,图像会变亮且对比度增加;若伽马值大于1,图像会变暗且对比度也可能增加,具体调整需依据图像实际情况确定。
70、考虑一个10×10的棋盘图像,其棋子是白色和灰色(值 = 128)而非白色和黑色。每个棋子的大小为10×10像素。画出该图像的直方图。你能想出另一个具有相同直方图的图像吗?请说明理由。
此棋盘图像直方图有两个峰值:
一个在灰度值为128(灰色)
另一个在灰度值为白色对应值处
两峰值高度大致相同。
可能具有相同直方图的图像如由白、灰方块随机分布组成的图像,因为只要图像中白色和灰色像素数量与棋盘图像相同,直方图就会一样。
71、考虑两个尺寸均为1000×1000的平坦方形图像,灰度值分别为200和100。a. 若融合宽度为10像素,融合后图像的尺寸是多少?b. 线性融合会产生马赫带,一种解决方法是使用余弦融合。使用300像素的融合区域能否缓解这个问题?请说明理由。c. 使用这个更宽的融合区域时,图像的最终尺寸是多少?d. 300像素的线性斜坡和10像素的余弦斜坡,哪种解决方案能产生更好的融合效果?请说明理由。e. 除了融合质量,你是否还会因为其他原因选择较小的融合宽度?
a. 融合后图像尺寸为1000×1000。
因为两个1000×1000的图像进行融合,融合宽度只是在融合过程中处理的区域,不改变图像整体尺寸。
b. 使用300像素的融合区域能缓解马赫带问题。
因为更宽的融合区域可以使图像灰度值的过渡更加平滑,减少灰度值突变,从而缓解马赫带现象。
c. 使用更宽融合区域时图像的尺寸仍为1000×1000。
原因同a,融合区域宽度不改变图像整体尺寸。
d. 10像素的余弦斜坡可能产生更好的融合效果。
因为余弦斜坡函数的梯度是连续的,不会出现梯度不连续导致的马赫带,而线性斜坡可能会因梯度不连续产生马赫带。
e. 较大的融合宽度可能导致重影,所以除融合质量外,为避免重影也可能选择较小的融合宽度。
72、如果图像的色温不同,在进行图像拼接(包括图像融合和图像切割)之前,应该应用什么技术来确保获得更好的拼接质量?
可考虑使用色彩校正技术,如直方图匹配、色彩平衡调整等,使图像的颜色温度趋于一致。
73、考虑一个位于XY平面上的二维正方形,边长为2个单位,中心在原点,四条边与坐标轴平行或垂直。绘制该正方形经过以下一系列操作后的变换图形:绕Z轴逆时针旋转45度,沿(2, 0, 0)平移,再绕Z轴逆时针旋转45度。能否简化这些变换,给出新的变换序列以达到相同的结果?
可先将两次绕Z轴逆时针旋转45度合并为绕Z轴逆时针旋转90度,新序列为:
绕Z轴逆时针旋转90度
沿(2, 0, 0)平移
74、考虑一个位于 XY 平面的二维正方形,边长为 2 个单位,中心在原点,四条边平行或垂直于坐标轴。绘制经过以下一系列操作后变换后的正方形图像:先沿 (2, 2, 0) 进行平移,再按 (3, 2, 1) 进行缩放。
操作步骤为:
先将正方形中心从原点平移至 (2, 2)。
再将平移后的正方形在 X 方向缩放 3 倍、Y 方向缩放 2 倍、Z 方向缩放 1 倍。
最后根据这些步骤绘制出变换后的正方形。
75、考虑一个位于XY平面上的二维正方形,边长为2个单位,中心在原点,四条边平行或垂直于坐标轴。已知两个操作分别是先平移(2, 2, 0),再缩放(3, 2, 1),画出这两个操作交换顺序(即先缩放(3, 2, 1),再平移(2, 2, 0))后正方形的图形。
需根据操作(先缩放(3, 2, 1),再平移(2, 2, 0)),结合正方形初始状态,通过坐标变换计算顶点新坐标来绘制图形。
76、有一个观察者,其定义如下:(a) 眼睛位置:(0, 0, 0);(b) 上视向量:(0, 2, 0);(c) 图像平面方程:x + y + z = 6。求此视图设置下的视图变换矩阵。设左、右、上、下平面分别位于 -2、+2、4 和 8 处,远平面位于 10 处。求由 L 表示的透视投影矩阵。求点 P = (10, 4, 6) 在此观察者下的投影坐标。
需通过以下步骤求解:
根据给定的眼睛位置、上视向量和图像平面方程,按视图变换的步骤(先平移使眼睛到原点,再旋转使图像平面法向量与 Z 轴对齐)计算视图变换矩阵;
根据左右上下平面及远平面位置确定透视投影矩阵;
用视图变换矩阵和透视投影矩阵计算点 P 的投影坐标。
77、场景的模型变换是绕Y轴逆时针旋转90度(旋转矩阵为R),接着沿X轴正方向平移20个单位(平移矩阵为T)。最终的变换是什么?
最终的变换矩阵为平移矩阵 $ T $ 与旋转矩阵 $ R $ 的乘积,即 $ TR $,矩阵大小为 $ 4 imes 4 $,因为是对 4D 齐次坐标进行变换。若用数学形式表达,设旋转矩阵为 $ R $,平移矩阵为 $ T $,结果为 $ TR $。
78、考虑一个三角形 ABC,我们想用条纹纹理对其进行纹理映射。将纹理的左下角设为 (0, 0),右上角设为 (1, 1)。分别找出为 A、B 和 C 分配的纹理坐标,以在以下每个方向上创建条纹外观:(a) 水平,(b) 垂直,(c) 与纹理相同方向的对角线,(d) 与纹理垂直方向的对角线。
(a)水平方向:可将 A、B、C 的纹理坐标中 y 坐标保持一致,x 坐标根据三角形顶点在水平方向的位置按比例分配在 0 – 1 之间;
(b)垂直方向:将 A、B、C 的纹理坐标中 x 坐标保持一致,y 坐标根据三角形顶点在垂直方向的位置按比例分配在 0 – 1 之间;
(c)与纹理相同方向的对角线:可根据三角形顶点在对角线上的位置,使纹理坐标的 x 和 y 坐标按相同比例变化;
(d)与纹理垂直方向的对角线:同样根据顶点位置,使纹理坐标的 x 和 y 坐标按与(c)相反的比例变化。
具体坐标需根据三角形 ABC 的具体位置和形状确定。