图像处理与视觉感知---期末复习重点(1)

news/2024/7/21 5:46:45 标签: 人工智能, 图像处理, 视觉感知, 笔记记录

文章目录

  • 一、概述
  • 二、图像处理基础
    • 2.1 视觉感知要素
    • 2.2 像素间的一些基本关系
      • 2.2.1 相邻像素
      • 2.2.2 连通性
      • 2.2.3 距离度量
    • 2.3 基本坐标变换
    • 2.4 空间变换与灰度值


一、概述

 1. 图像的概念及分类。
 图像是用各种观测系统以不同形式和手段观测客观世界而获得的、可以直接或间接作用于人的视觉系统而产生的视知觉实体。
 图像分为模拟图像和数字图像:(1) 模拟图像:二维空间和亮度都是连续值的图像。亮度值连续且不分等级。 (2) 数字图像:二维空间和亮度都是用有限数字数值表示的图像。

 2. 像素表示的矩阵、矢量形式。
 一幅图像可分解为许多个单元。每个基本单元叫做图像元素,简称像素。

在这里插入图片描述

 3. 图像工程的三个层次。

在这里插入图片描述

二、图像处理基础

2.1 视觉感知要素

 1. 亮度适应与辨别:
 (1) 主观亮度:即人眼感知到的亮度,是进入人眼的光强的对数函数。
 (2) 亮度适应现象:感知亮度不是亮度的简单函数。① 马赫带:视觉系统往往会在不同强度区域的边界处出现“ 下冲”或“上冲”现象(毛边)。② 同时对比:感知区域的亮度与背景亮度相关。

 2. 当在白天进入一个黑暗剧场时,在能看清并找到空座位时需要适应一段时间,试述发 生这种现象的视觉原理?
 答:人的视觉绝对不能同时在整个亮度适应范围工作,它是利用改变其亮度适应级来完成亮度适应的,即所谓的亮度适应范围。同整个亮度适应范围相比,能同时鉴别的光强度级的总范围很小。因此,白天进入黑暗剧场时,人的视觉系统需要改变亮度适应级,因此,需要适应一段时间,亮度适应级才能被改变。

2.2 像素间的一些基本关系

2.2.1 相邻像素

 1. 相邻像素:4邻域、D邻域、8邻域。

 2. 4邻域:像素 p ( x , y ) p(x,y) p(x,y) 的4邻域是 (x+1,y);(x-1,y);(x,y+1);(x,y-1)。用 N 4 ( p ) N_4(p) N4(p) 表示像素 p p p 的4邻域。

在这里插入图片描述

 3. D邻域:像素 p ( x , y ) p (x,y) p(x,y) 的D邻域是对角上的点 (x+1,y+1);(x+1,y-1);(x-1,y+1);(x-1,y-1)。用 N D ( p ) N_D(p) ND(p) 表示像素 p p p 的D邻域。

在这里插入图片描述

 4. 8邻域:像素 p ( x , y ) p(x,y) p(x,y) 的8邻域是4邻域的点+D邻域的点。用 N 8 ( p ) N_8(p) N8(p) 表示像素 p p p 的8邻域,即 N 8 ( p ) = N 4 ( p ) + N D ( p ) N_8(p)=N_4(p)+N_D(p) N8(p)=N4(p)+ND(p)

在这里插入图片描述

2.2.2 连通性

 1. 两个像素连通的两个必要条件是:两个像素的位置是否相邻;两个像素的灰度值是否满足特定的相 似性准则(或者是否相等)。

 2. 4连通:对于具有值 V V V 的像素 p p p q q q,如果 q q q 在集合 N 4 ( p ) N_4(p) N4(p) 中, 则称这两个像素是4连通的。

在这里插入图片描述

 3. 8连通:对于具有值 V V V 的像素 p p p q q q,如果 q q q 在集合 N 8 ( p ) N_8(p) N8(p) 中, 则称这两个像素是8连通的。

在这里插入图片描述

 4. 对于具有值 V V V 的像素 p p p q q q,如果: q q q 在集合 N 4 ( p ) N_4(p) N4(p) 中;或 q q q 在集合 N D ( p ) N_D(p) ND(p) 中,并且 N 4 ( p ) N_4(p) N4(p) N 4 ( q ) N_4(q) N4(q) 的交集为空(没有值V的像素)则称这两个像素是m连通的。

在这里插入图片描述

 5. 通路的定义:一条从具有坐标 ( x , y ) (x,y) (x,y) 的像素 p p p,到具有坐标 ( s , t ) (s,t) (s,t) 的像素 q q q 的通路,是具有坐标 ( x 0 , y 0 ) , ( x 1 , y 1 ) , . . . , ( x n , y n ) (x_0,y_0),(x_1,y_1),...,(x_n,y_n) (x0,y0)(x1,y1)...(xn,yn) 的不同像素的序列。其中, ( x 0 , y 0 ) = ( x , y ) (x_0,y_0)=(x,y) (x0,y0)=(x,y) ( x n , y n ) = ( s , t ) (x_n,y_n)=(s,t) (xn,yn)=(s,t) ( x i , y i ) (x_i,y_i) (xi,yi) ( x i − 1 , y i − 1 ) (x_{i-1},y_{i-1}) (xi1,yi1) 是邻接的, 1 ≤ i ≤ n 1 ≤ i ≤ n 1in n n n 是路径的长度。如果 ( x 0 , y 0 ) = ( x n , y n ) (x_0,y_0)=(x_n,y_n) (x0,y0)=(xn,yn),则该通路是闭合通路。

在这里插入图片描述

2.2.3 距离度量

 1. 基本定义如下:

在这里插入图片描述

在这里插入图片描述

 2. 一道例题如下,通过上面的公式可以解决下面题目中的距离问题。

在这里插入图片描述

在这里插入图片描述

2.3 基本坐标变换

 1. 坐标变换可借助矩阵写为: v ′ = T v v' =Tv v=Tv

在这里插入图片描述

 2. 例子:先放大2倍,然后旋转45度,然后再缩小0.5倍。

在这里插入图片描述

 3. 平移变换并不是矩阵乘法的形式,而是矩阵加法的形式。

在这里插入图片描述

 4. 改变图像的像素值,我们称为滤波(Filtering)。改变图像的像素位置,我们称为扭曲(Warping)。

在这里插入图片描述

 5. 转置变换:图像转置是指将图像像素的x坐标和y坐标互换。图像的大小会随之改变,高度和宽度将互换。

在这里插入图片描述

 6. 尺度变换(放缩变换):

在这里插入图片描述

 7. 旋转变换矩阵:

在这里插入图片描述

2.4 空间变换与灰度值

 1. 几何变换可在一幅图像中的像素间修改空间联系。几何变换通常又叫做橡皮片变换,因为它们可以被看做在一片橡皮片上打印图像,然后根据预先确定的规则拉伸这个橡皮片的过程。

 2. 在数字图像处理中,几何变换由两个基本操作组成:空间变换,它定义了图像平面上像素的重新安排;灰度级插补,处理空间变换后图像中像素灰度级的赋值。

 3. 空间变换:图显示了在失真和相应的校正图像中的四边形区域,四边的顶点是相应的 “连接点”。

 4. 灰度级插补:图像经几何位置校正后,在校正空间中各像点的灰度值等于被校正图像对应点的灰度值。一般校正后的图像某些像素点可能挤压在一起,或者分散开,不会恰好落在坐标点上,因此常采用内插法来求得这些像素点的灰度值。
 常用的有:最邻近插值法、双线性插值法(一阶插值)、高阶插值法。

 5. 最近邻插值法:计算与点 P ( x 0 , y 0 ) P(x_0,y_0) P(x0y0) 临近的四个点,将与点 P ( x 0 , y 0 ) P(x_0,y_0) P(x0y0) 最近的整数坐标点 ( x , y ) (x,y) (xy) 的灰度值取为 P ( x 0 , y 0 ) P(x_0,y_0) P(x0y0) 点灰度近似值。

在这里插入图片描述

 6. 线性插值法:

在这里插入图片描述

 7. 三阶插值:是指用 ( x , y ) (x ,y) (x,y) 周围的16个网格点灰度按三次多项式进行内插的高精度算法。

在这里插入图片描述

 8. 常用的灰度插值有几种,概括它们的优缺点:

  • 最邻近插值法, 这种方法简单但效果不太好。
  • 双线性插值(一阶插值):计算量大,但缩放后图像质量高,不会出现图像不连续的情况。
  • 高阶插值:计算量最大,插值后图像的视觉质量最好。

http://www.niftyadmin.cn/n/5410333.html

相关文章

Linux系统:内核参数调优

目录 1、/proc目录 2、sysctl命令 3.1 控制源路由验证 3.2 控制内核的系统请求调试功能 3.3 控制核心转储是否将PID附加到核心文件名 3.4 控制TCP同步cookie的使用 3.5 在网桥上禁用netfilter 3.6 控制消息队列的默认最大大小 3.7 调试TCP内核参数 3.8 调试套…

动手学深度学习-现代循环神经网络(GRU、LSTM、编码器-解码器等)

现代循环神经网络 上一章节(循环神经网络)介绍了循环神经网络的基础知识,这种网络可以更好的处理序列数据。我们在文本数据上实现了基于循环神经网络的语言模型,但是对于当今各种各样的序列学习问题,这些技术可能不够…

⁴ 细说IT从业者35岁,真的是职业的转折点吗

IT从业者如何跨过35岁职业门槛是一个很重要的问题。 一 虽然年龄可能会成为一些公司在招聘过程中的考虑因素,但是有一些方法可以帮助你克服这个挑战并继续在IT行业中发展。 首先,持续学习和自我提升非常重要。随着科技的不断发展,IT行业也在不…

深度解析速卖通商品详情API:Python实战与高级技术探讨

速卖通商品详情API接口实战:Python代码示例 一、准备工作 在开始之前,请确保你已经完成了以下步骤: 在速卖通开放平台注册账号并创建应用,获取API密钥。阅读速卖通商品详情API接口的文档,了解接口的使用方法和参数要…

c++function和bind

1.function和bind的简介 在c11中提供了两个方法std::bind和std::function对回调对象进行封装。 主要是在使用回调函数的时候进行使用。 function可以看作一个包装器,对可调用对象进行包装。 c里面的可调用对象包括:函数,函数指针,lambda表…

[python] 代码工具箱

在 Python 3 的开发过程中,有一些小而实用的工具包可以帮助减轻开发负担,提升工作效率。这些工具包通常专注于解决特定问题或提供特定功能,使代码更简洁和可维护。以下是一些常用的工具包,可以简化开发过程: backoff&a…

nodejs:npm i与npm i -S、npm i -D区别

npm i(或 npm install) pnpm中如果pnpm add安装不了,可以试试使用pnpm i 这是最基础的安装命令,用于安装项目的依赖项。 若在项目根目录下运行,且没有指定具体的包名,则会安装package.json文件中列出的所有…

【GPU驱动开发】- mesa编译与链接过程详细分析

前言 不必害怕未知,无需恐惧犯错,做一个Creator! 一、总体框架图 暂时无法在飞书文档外展示此内容 二、Mesa API 处理 OpenGL 函数调用 Mesa API 负责实现 OpenGL 和其他图形 API 的函数接口。Mesa API 表是一个重要的数据结构&#xf…