1、请说明《Matlab Companion to this text》[Svoboda 等人,2008 年]对应章节中提供了什么内容,以及该书配套的 Matlab 资源主页提供了什么?
《Matlab Companion to this text》[Svoboda 等人,2008 年]对应章节中提供了所选算法的已解问题和 Matlab 实现。该书配套的 Matlab 资源主页( http://visionbook.felk.cvut.cz )提供了习题所用图像,还有注释详尽的 Matlab 代码供教学使用。
2、使用合适的编程语言(如 Matlab)开发一些额外练习和实际问题的解决方案,请说明具体操作步骤。
先熟悉选定算法的已解决问题和实现代码 利用提供的图像和注释完善代码 开发额外练习和实际问题的解决方案 再用 Matlab 或其他合适编程语言实现这些方案
3、定义:空间分辨率、光谱分辨率、辐射分辨率、时间分辨率
以下是调整为 Markdown 格式的文本内容:
空间分辨率 :由图像平面中图像样本的接近程度决定; 光谱分辨率 :由传感器捕获的光频率带宽决定; 辐射分辨率 :对应可区分的灰度级数; 时间分辨率 :由捕获图像的时间样本之间的间隔决定。
4、为什么像NTSC、PAL这样已有数十年历史的模拟电视标准采用隔行扫描图像线?
采用隔行扫描图像线是为了减少阴极射线管(CRT)屏幕上的图像闪烁。
5、请解释加性噪声、乘性噪声、高斯噪声、脉冲噪声、椒盐噪声的定义
噪声类型描述
加性噪声
当图像通过某个通道传输时,通常与图像信号无关的噪声会出现,这种与信号无关的退化称为加性噪声,可由模型
f(x, y) = g(x, y) + η(x, y)
描述,其中噪声η和输入图像g是独立变量。
乘性噪声
噪声幅度在很多情况下取决于信号幅度本身,由模型
f = g η
描述的噪声为乘性噪声,如电视光栅退化就是乘性噪声的一个例子。
高斯噪声
是白噪声的一种特殊情况,随机变量具有高斯(正态)分布,其概率密度函数由高斯曲线给出,在一维情况下,密度函数为
p(x) = 1 / (σ√(2π)) e^(-(x - μ)^2 / (2σ^2))
其中μ是随机变量的均值,σ是标准差,高斯噪声能很好地近似许多实际情况下出现的噪声。
脉冲噪声
指图像被个别噪声像素破坏,这些像素的亮度与邻域像素的亮度有显著差异。
椒盐噪声
用于描述饱和脉冲噪声,图像被白色和/或黑色像素破坏的情况就是椒盐噪声的例子,它能破坏二值图像。
6、解释颜色恒常性的概念。为什么它对彩色图像处理和/或分析很重要?
颜色恒常性
颜色恒常性指在不同光照条件下,人类视觉系统能在一定程度上忽略光照变化,将特定颜色的多个实例感知为相同颜色的现象。
对于彩色图像处理和分析而言,颜色恒常性很重要,因为实际场景中光照条件复杂多变。真实世界里,光照光谱通常未知,若能实现颜色恒常性,可使图像处理系统像人类视觉系统一样,在不同光照下准确感知颜色,避免因光照变化导致颜色判断失误,从而提高图像分析的准确性和可靠性。
应用示例
自动白平衡 图像识别
颜色恒常性有助于减少光照对颜色的影响,提升处理效果。
7、讨论影响图像中像素亮度的各种因素。
影响图像中像素亮度的因素主要有以下方面:
图像采集和数字化设备特性
镜头会使离光轴越远的光线衰减更多,传感器的感光部分灵敏度不均匀,导致像素亮度受位置影响。
物体照明情况
不均匀的物体照明会造成图像中像素亮度的差异。
噪声特性
噪声的性质(通常是其光谱特性)有时会影响像素亮度。
视觉感知因素
人类对亮度的感知具有对数敏感性,且受局部环境亮度影响,即条件对比度会使相同亮度的像素被感知为不同亮度。
图像退化
图像采集过程中的退化会改变像素原始亮度,如存在系统误差时,可通过亮度校正来处理。
灰度变换
不依赖像素位置的灰度变换会改变像素亮度。
8、请给出频率谱、相位谱、功率谱的定义。
频率谱:
$ F(omega) = ext{Re}(F(omega)) + i, ext{Im}(F(omega)) $
相位谱:
$ phi(omega) = arctanleft( frac{ ext{Im}(F(omega))}{ ext{Re}(F(omega))}
ight) $ (若有定义)
功率谱:
$ P(omega) = |F(omega)|^2 = ext{Re}(F(omega))^2 + ext{Im}(F(omega))^2 $
9、解释如何使用傅里叶变换去除图像中的周期性噪声。
可将图像转换到频域,在频域中找出与周期性噪声对应的频率区域(如周期性垂直线对应的频率区域),将这些区域过滤掉,再通过逆傅里叶变换将处理后的频域表示转换回空间域,得到去除周期性噪声后的图像。
10、为什么小波比傅里叶变换更适合在多尺度上分析图像数据?
用大量函数之和对函数中的尖峰(如噪声点)进行建模很难,因为尖峰的局部性很强。而本身具有局部性的函数更适合完成此任务,这意味着与正弦 – 余弦基函数相比,尖峰和不连续点通常用更少的小波基就能表示。
小波在空间域的局部化以及在频率上的局部化,能对许多实际信号进行稀疏表示,这种稀疏性为数据/图像压缩、噪声过滤和图像特征检测等成功应用打开了大门。
11、从傅里叶频率重叠的角度解释混叠效应。
傅里叶变换与图像混叠
傅里叶变换结果 $ F(u, v) $ 的周期性重复在特定条件下会导致图像失真,即 混叠 。
当图像频谱有限的傅里叶变换结果 $ F(u, v) $ 的各个数字化分量重叠时,就会发生混叠。
防止混叠的方法
若选择合适的采样间隔,使得:
Δx<12U且Δy<12VΔx<12U且Δy<12V
(其中 $ U $、$ V $ 为最大频率),可防止傅里叶变换结果的周期性重复重叠,从而避免混叠。
图像重建中的混叠问题
在实际图像重建过程中,欠采样图像在重建连续图像函数用于显示时,混叠会导致图像质量下降。
抗混叠技术
可通过抗混叠技术(如插值相邻像素亮度值)改善图像质量,但由于计算要求较高,实际图像处理设备中很少使用此类方法。
12、(a) 什么是积分图像?(b) 描述一种简单高效的构建积分图像的算法。
(a) 积分图像是一种另一种矩阵表示形式,其保存了全局图像信息。其位置 $(i, j)$ 处的值 $ii(i, j)$ 表示原始图像中位于 $(i, j)$ 左方和上方的所有像素值之和,即:
ii(i,j)=∑k≤i,l≤jf(k,l)ii(i,j)=∑k≤i,l≤jf(k,l)
其中 $f$ 是原始图像。
(b) 算法如下:
设 $s(i, j)$ 表示累积行和,并设 $s(i, -1) = 0$; 设 $ii(i, j)$ 为积分图像,并设 $ii(-1, j) = 0$; 逐行遍历图像,对于每个像素 $(i, j)$,使用以下递推公式计算累积行和 $s(i, j)$ 和积分图像值 $ii(i, j)$:
s(i,j)=s(i,j−1)+f(i,j)s(i,j)=s(i,j−1)+f(i,j)
ii(i,j)=ii(i−1,j)+s(i,j)ii(i,j)=ii(i−1,j)+s(i,j) 完成一次图像遍历后,积分图像 $ii$ 构建完成。
13、定义游程编码。
游程编码已被用于表示图像矩阵中的符号串一段时间了。为简单起见,先考虑二值图像。游程编码仅记录图像中属于物体的区域;该区域随后表示为列表的列表。
存在各种细节不同的方案——一种有代表性的方案用子列表描述图像的每一行,子列表的第一个元素是行号。后续项是坐标对;对中的第一个元素是游程的起始位置,第二个元素是结束位置(起始和结束由列坐标描述)。一行中可以有多个这样的序列。
游程编码也可用于具有多个亮度级别的图像——在这种情况下,会考虑一行中具有恒定亮度的相邻像素序列。在子列表中,不仅要记录序列的起始和结束,还需记录其亮度。
14、定义区域邻接图。
区域邻接图
区域邻接图是一种拓扑数据结构,其中:
节点 对应图像中的区域 相邻区域 由一条弧连接
分割后的图像由具有相似属性(如亮度、纹理、颜色等)的区域组成。这些区域对应于场景中的某些实体,当它们具有共同边界时,即满足邻接关系。
该图通常由 区域图 创建,区域图是一个与原始图像矩阵维度相同的矩阵,其元素为区域的标识标签。
15、请定义 M – 金字塔
M - 金字塔(矩阵金字塔)是图像序列 `{ML, ML - 1, ..., M0}`,其中 `ML` 与原始图像具有相同的维度和元素,`Mi - 1` 是通过将 `Mi` 的分辨率降低一半得到的。创建金字塔时,通常使用维度为 2 的幂的方阵,此时 `M0` 仅对应一个像素。
16、定义T – 金字塔。
设 $ 2^L $ 为原始图像的大小(最高分辨率),树金字塔(T-金字塔)由以下部分定义:
节点集合 $ P = { p = (k, i, j) mid ext{层级 } k in [0, L]; i, j in [0, 2^k – 1] } $; 金字塔中后续节点 $ P_{k-1} $、$ P_k $ 之间的映射 $ F $:
F(k,i,j)=(k−1,⌊i2⌋,⌊j2⌋)F(k,i,j)=(k−1,⌊i2⌋,⌊j2⌋) 函数 $ V $,将金字塔的节点 $ P $ 映射到 $ Z $,其中 $ Z $ 是对应亮度级别数量的整数子集,例如 $ Z = {0, 1, 2, dots, 255} $。
T-金字塔的节点对于给定的 $ k $ 对应于 M-金字塔的图像点,节点集合 $ P = {(k, i, j)} $ 的元素对应于 M-金字塔中的各个矩阵,$ k $ 称为金字塔的层级。
17、熟悉《Matlab Companion to this text》(作者为Svoboda等人,2008年出版)对应章节中提供的已解决问题和所选算法的Matlab实现。该Matlab Companion的主页http://visionbook.felk.cvut.cz提供了问题中使用的图像,并且为教育目的提供了注释完善的Matlab代码。
熟悉《Matlab Companion》(作者为Svoboda等人,2008年出版)对应章节中所选算法的已解问题和Matlab实现。该《Matlab Companion》的主页 http://visionbook.felk.cvut.cz 提供了问题所用的图像,同时还为教学目的提供了注释详尽的Matlab代码。
18、给定一组多维样本,均值漂移过程的结果是什么?
均值漂移过程
均值漂移过程的结果是识别出概率密度函数的 局部密度最大值 或 局部模式 。
该过程通过迭代,不断确定区域的质心并移动区域,直到 收敛 ,最终位置即为 局部密度最大值 或 局部模式 。
19、描述均值漂移分割的原理。
均值漂移分割
均值漂移分割避免了概率密度函数的估计,由两个主要步骤组成:
保间断滤波 均值漂移聚类
过程简介
均值漂移过程最初在1975年被提出,20年后重新引入。
在图像处理中,特征空间由定量图像属性组成,映射到图像描述参数的多维空间中的点。完成所有图像点的映射后,特征空间中对应重要图像特征的位置会更密集,这些密集区域形成聚类,在图像分割中可能对应单个图像对象和背景。
直观描述
均值漂移过程的直观描述是在迭代过程中识别数据的最密集区域:
初始感兴趣区域随机放置在数据上并确定其质心; 将区域移动到识别出的质心位置,该位置变化的向量即为 均值漂移 ; 后续步骤不断确定新的均值漂移向量,直到收敛; 最终位置确定概率密度函数的局部密度最大值或局部模式。
算法步骤
均值漂移图像分割算法步骤为:
采用算法7.2并存储d维收敛点的信息; 通过将在空间域中距离小于hs且在范围域中距离小于hr的点分组来确定聚类; 为每个像素分配所属聚类; 若需要,按算法6.22消除小于P像素的区域。
20、什么是吸引域?
集水盆与吸引域
景观中能将水吸引到特定湖泊或海洋的区域被称为 集水盆 ,这些区域是图像中局部最小值的影响区域,可类比理解为 吸引域 。在图像分割相关内容里,集水盆对应着吸引域的概念。
21、给出一个有用的蛇形内部能量的例子,并解释其目的和影响。
有用的蛇形内部能量例子为:
Eint=α(s)∣∣∣dvds∣∣∣2+η(s)∣∣∣d2vds2∣∣∣2Eint=α(s)|dvds|2+η(s)|d2vds2|2
目的是确保蛇形曲线具有连续性等理想属性,其中 $alpha(s)$ 和 $eta(s)$ 分别指定蛇形的弹性和刚度。
影响是设置 $eta(s_k) = 0$ 时,蛇形在该点可出现二阶不连续并形成拐角。
22、给出一个有用的外部蛇形能量的例子,并解释其目的和影响。
外部蛇形能量的一个例子是基于图像数据的能量项 $ E_{image} $,它是 $ E_{line} $、$ E_{edge} $ 和 $ E_{term} $ 的加权组合,即
Eimage=wlineEline+wedgeEedge+wtermEtermEimage=wlineEline+wedgeEedge+wtermEterm
目的是吸引蛇形模型到图像中的特定特征,如线条、边缘和端点。
影响是通过调整权重 $ w_{line} $、$ w_{edge} $、$ w_{term} $ 来控制蛇形的行为,使其朝着期望的图像特征移动,最终定位到图像中具有特定属性的轮廓位置。
23、梯度向量流场在主动轮廓分割中的作用是什么?
梯度向量流场增加了蛇形模型吸引的有效区域,降低了蛇形模型对初始化的敏感性,并允许分割凹边界。
24、对于水平集“速度函数”:(a) 解释该函数在图像分割中的主要作用。(b) 给出一个基于曲率和恒定变形的函数的一般表达式。(c) 利用这个函数,解释导致收敛的行为。
(a) 速度函数在图像分割中的主要作用是定义曲线的演化过程,使曲线根据图像数据局部地改变其演化速度,最终目标是让曲线演化在物体边界处停止,从而实现图像分割。
(b) 基于曲率和恒定变形的速度函数的一般表达式为:
∂φ∂t=k(c+V0)|∇φ|∂φ∂t=k(c+V0)|∇φ|
其中
k=11+|∇(Gσ∗I)|k=11+|∇(Gσ∗I)|
(c) 在这个函数中,$ V_0 $ 为正值时会使曲线扩张,$ k $ 作为停止项,当图像位置处的图像梯度较大(即图像边缘)时,$ k $ 趋近于 0。这意味着在图像边缘处曲线演化会几乎停止,从而使曲线收敛于物体边界。但该函数在较弱或不明显的边界处不能充分减速,一旦曲线越过边界位置,就会继续移动而没有力将其拉回。
25、定义模糊连通性。
模糊连通性是一种全局模糊关系,它基于两个图像元素 $ c $ 和 $ d $ 之间所有可能路径的亲和度值,为每对图像元素 $ c $ 和 $ d $ 分配一个区间 $[0,1]$ 内的值。
设 $ M $ 表示连接 $ c $ 和 $ d $ 的路径集合,模糊连通性定义为:
μ(c,d)=maxπ∈Mμ′(π)μ(c,d)=maxπ∈Mμ′(π)
即 $ c $ 和 $ d $ 的模糊连通性(全局连接性)值由 $ c $ 和 $ d $ 之间所有可能路径的最大强度决定。
26、解释如何使用图搜索同时检测最优边界对。如何从底层图像数据确定一对边界点的成本?
使用图搜索同时检测最优边界对的方法
为准确识别区域边界,同时检测方法的关键在于为候选边界对分配成本,并在三维图中识别最优的区域边界对或成本最低的路径。
成本函数定义后,可使用 启发式图搜索 或 动态规划 等方法进行最优边界检测。通过在三维图中寻找路径来促进边界对的最优识别。
从底层图像数据确定一对边界点成本的方式
三维图中路径的成本定义为构成该路径的节点成本之和。
成本函数定义
成本函数定义为:
Ctotal(x,y,z)=(Cs(x,y,z)+Cpp(x,y,z))⋅w(x,y,z)−PL(z)+PR(z)Ctotal(x,y,z)=(Cs(x,y,z)+Cpp(x,y,z))⋅w(x,y,z)−PL(z)+PR(z)
其中,各组成部分取决于与图像像素相关的边缘成本。
左、右边缘候选的边缘成本 $ C_L(x, z) $、$ C_R(y, z) $ 与有效边缘强度或其他适当的局部边界属性描述符 $ E_L(x, z) $、$ E_R(y, z) $ 成反比。 $ C_s $ 是左右边界候选成本之和。 $ C_{pp} $ 项用于在一侧边界比另一侧边界有更高对比度等情况时,使低对比度边界的位置受高对比度边界位置的影响。
27、解释为什么在二维图像中同时检测两个边界需要一个三维图;简述如何构建这样的图。
在二维图像中同时检测两个边界时,若目标是确定细长物体的边界,同时搜索左右边界对可能更有利。因为当边界对中的边界相互关联时,这种方法能让一个边界的信息帮助识别另一个边界,提升性能。
而要搜索最优边界对,图必须是三维的。构建三维图时,先有两个相邻但独立的二维图,其中的节点对应拉直边缘图像中的像素,分隔左右图的节点列对应近似区域中心线的像素,左图中的一行节点对应沿垂直于区域中心线且在其左侧的直线上重采样的像素。
28、将二值分割问题表述为在图中搜索最小割的问题。
首先,创建一个与待分割图像大小和维度对应的弧加权有向图。确定代表目标和背景的种子点,创建源节点 s 和汇节点 t ,并根据种子点的目标或背景标签将其与源节点或汇节点相连。
根据规则为图的每条边关联合适的弧成本。使用最大流图优化算法确定图的割,最小 s – t 割的解能识别出对应于分隔目标和背景的图像边界的图节点,从而实现二值分割。
29、推导水平集函数随时间的演化与等值线法向速度之间的关系。
已知水平集函数φ(x, y, t),其零水平集为轮廓X(s, t),即
φ[X(s, t), t] = 0。
对其关于t求导,应用链式法则可得
∂φ∂t+∇φ⋅∂X∂t=0∂φ∂t+∇φ⋅∂X∂t=0
假设φ在零水平集内部为负,外部为正,水平集曲线的向内单位法向为
N=−∇φ|∇φ|N=−∇φ|∇φ|
由速度方程
∂X∂t=V(c)N∂X∂t=V(c)N
可得
∂X∂t=−V(c)∇φ|∇φ|∂X∂t=−V(c)∇φ|∇φ|
代入上式可得
∂φ∂t−∇φ⋅V(c)∇φ|∇φ|=0∂φ∂t−∇φ⋅V(c)∇φ|∇φ|=0
进而得到
∂φ∂t=V(c)|∇φ|∂φ∂t=V(c)|∇φ|
此即为水平集函数随时间的演化与等值线法向速度之间的关系。
30、描述增广路径(福特 – 富尔克森)最大流搜索算法的主要原理。
增广路径最大流搜索算法的主要原理是 :
通过推动最大可能的流来扩充路径,使该路径上至少有一条弧达到饱和。
即沿着路径的流增加 Δf,路径弧的剩余容量减少 Δf,反向路径弧的剩余容量增加 Δf。
每一次扩充步骤都会增加从源点到汇点的总流量。
当流量无法再增加时(即无法定义仅由非饱和弧组成的新的源点到汇点的路径),达到最大流,优化过程终止。
定义分割的 S 和 T 图节点的分离(即最小 s – t 割)由饱和的图弧确定。
31、解释主动视觉的基本概念,并举例说明这种方法如何简化视觉任务。
主动视觉
主动视觉是指在主动视觉系统中,数据采集的特征由场景解释动态控制,即智能数据采集受测量到的、部分解释的场景参数及其误差控制。
例如,当没有足够数据解释场景时,可控制相机(或眼睛)移动,从另一个视角观察场景。
主动视觉能使大多数不适定的视觉任务变得适定,如从明暗恢复形状:
被动观察者面临的任务是不适定的,正则化有帮助但因非线性不能保证唯一解; 而主动观察者面临的任务是适定的,有稳定且唯一的解,可用线性方程求解。
在以下任务中,主动观察者也能使任务从不适定或不稳定变为适定且稳定:
从轮廓恢复形状 从纹理恢复形状 由运动恢复结构
32、给出日常生活中透视图像的例子。现实世界中的平行线在哪些图像中不对应平行?
日常生活中透视图像的例子如沿着铁路的视图或看向长走廊的视图。在透视投影的图像中,现实世界中的平行线不对应平行,例如平行直线在透视投影后不再平行。
33、在两个相机光轴平行(立体视觉的标准配置)的情况下,极点在哪里?
在标准配置下,光轴平行,极点移动到无穷远。
34、立体视觉中基础矩阵和本质矩阵有什么区别?
以下是调整为 Markdown 格式的内容:
基础矩阵
用于任意相机矩阵,其秩为 2,能从对应点获取相机对的所有信息;
F
本质矩阵
用于已知内参的特定形式相机矩阵,其秩也为 2,但满足额外约束,即两个非零奇异值相等,还能描述相机的相对运动。
E
35、极线几何在计算机视觉中有哪些应用?
以下是将给定文本内容调整为 Markdown 格式的结果:
极线几何在计算机视觉中的应用包括:
图像校正 根据校准相机测量进行自我运动估计 根据两个完全校准的相机进行3D欧几里得重建 根据仅已知内参校准参数的两个相机进行3D相似重建 根据两个未校准的相机进行3D投影重建 极线转移(若已知两个图像和三焦点张量,则可计算第三个透视图像)
36、如果左右图像有大面积均匀亮度区域,立体匹配算法通常会失效。如何仍然实现深度获取?
任何立体匹配算法都可以通过向场景投射随机点光模式来增强,从而即使在场景中纹理均匀的区域也能提供匹配模式。
37、什么是莫尔干涉测量法?它能给出绝对深度吗?
莫尔干涉测量法简介
莫尔干涉测量法是将两个周期性图案(通常是条纹)投射到场景中,由于干涉,物体被一组封闭、不相交的曲线覆盖,每条曲线都位于与观察者距离恒定的平面上。
特点
只能获得相对距离测量值 无法获得绝对距离
38、在哪些情况下可以从图像的强度变化中推导出表面方向?
当对光照、表面反射特性和表面光滑度做出简化假设时,从明暗恢复形状任务可解,能从强度图像中提取表面法线信息以推导表面方向。通常会做以下简化假设:
物体具有均匀的反射特性; 光源距离较远; 观察者距离非常远,透视投影简化为正交投影。
39、进行一次基于光度立体法的实验室实验。你需要一台相机和三个光源。取一个不透明物体,使用光度立体法测量其表面方向。
光度立体法简介
光度立体法假设 已知反射函数 ,能够明确恢复表面方向。
对于特定的 朗伯表面 ,关键是:
从一个固定视角观察表面 同时改变入射光照方向
若有该朗伯表面的 三张或更多图像 ,并且知道 光源位置 ,就能根据观察图像中的阴影变化唯一确定表面法线。
实验设置
一台相机 K(K ≥ 3)个点光源 每次仅一个光源开启 需进行 光度校准
校准后,图像会给出 K个图像辐照度的估计值 。
图像处理过程
对于图像中的每个点:
可得到一个 图像辐照度向量 光源方向可写成 K×3矩阵 图像辐照度方程组可写为:
E = ρLn
由此可推导出同时代表 表面反照率 和 局部表面方向 的向量。
40、请给出一个反例,其中由光流场测量的表观运动与3D点的实际运动不对应。[提示:考虑一个不透明的球体,(1)球体不移动但光照发生变化;(2)球体旋转但光照恒定。]
当不透明球体不移动但光照发生变化时:
– 光流场可能会检测到球体表面亮度模式的变化,从而产生表观运动。
– 然而,实际上球体本身并没有发生物理位置的移动,即3D点的实际位置未改变。
当不透明球体旋转但光照恒定时:
– 光流场会捕捉到球体表面纹理的移动,呈现出表观运动。
– 但对于球体上的每个3D点而言,它们只是在围绕球心做圆周运动,在某些情况下,从特定视角看,可能会出现光流场测量的表观运动与3D点实际运动的对应关系不直观的情况,例如在球体绕轴旋转时,光流场可能无法准确反映出3D点的真实旋转轨迹和速度。
41、描述如何从不同视角拍摄的距离图像创建物体的完整三维模型。
创建完整三维模型的步骤如下:
将物体放在转盘上,用结构光(激光平面)测距仪测量不同视角的一组距离图像。 在距离图像上构建三角化表面。 通过对每个视图中的三角网格进行抽取来减少大数据集。 将表面配准到一个共同的以物体为中心的坐标系中,并去除测量中的离群点。 通过表面融合过程重建物体的完整三维模型。
42、概述如何从一组无组织的2D视图中重建3D场景,需要哪些步骤?
从无组织的2D视图重建3D场景
可通过以下步骤实现:
检测2D特征 :使用Harris点检测器和/或最大稳定极值区域检测所有输入图像中的兴趣点和/或兴趣区域。 2D特征匹配 :对检测到的2D特征进行匹配。 估计3D点坐标 :通过特征匹配结果估计3D点的坐标。 束调整(优化) :使用最大似然估计(束调整)精确计算相机矩阵和场景点。 拟合曲面 :将曲面拟合到点云,得到场景的3D信息。
43、腐蚀是一种可交换的操作吗?
不是。腐蚀不具有交换性,即X ⊖ B ≠ B ⊖ X 。
44、一次开运算和两次开运算的结果有什么区别?幂等性是什么?
一次开运算和两次开运算的结果没有区别,因为开运算具有 幂等性 ,即:
X∘B=(X∘B)∘BX∘B=(X∘B)∘B
幂等性意味着对图像重复应用开运算或闭运算,不会改变之前的结果。
45、灰度膨胀和腐蚀是二值图像中相同概念的推广。描述它们是如何实现的。
灰度膨胀和腐蚀可通过“最小”和“最大”操作将二值形态学操作扩展到灰度图像。
灰度膨胀是为每个像素分配输入图像中对应像素邻域内的最大值,计算时需加上结构元素的值,可通过取一组和的最大值来计算,公式为:
(f⊕k)(x)=maxf(x−z)+k(z),z∈K,x−z∈F(f⊕k)(x)=maxf(x−z)+k(z),z∈K,x−z∈F
灰度腐蚀是为每个像素分配输入图像中对应像素邻域内的最小值,计算时需减去结构元素的值,实现步骤为取两个函数(点集)的本影,用二值腐蚀对其进行腐蚀,最后取结果的顶面,也可通过取一组差的最小值来降低计算复杂度,公式为:
(f⊖k)(x)=minz∈Kf(x+z)−k(z)(f⊖k)(x)=minz∈Kf(x+z)−k(z)