图像增强入门

对比度是画面黑与白的比值，也就是从黑到白的渐变层次。比值越大，从黑到白的渐变层次就越多，从而色彩表现越丰富。
对比度越大，不同颜色之间的反差越大。对比度过大，图像就会显得很刺眼。对比度越小，不同颜色之间的反差就越小。

饱和度是指图像颜色的浓度。饱和度越高，颜色越饱满，即所谓的青翠欲滴的感觉。饱和度越低，颜色就会显得越陈旧、惨淡，饱和度为0时，图像就为灰度图像。（R、G、B值相等）

直方图均衡化：假如图像的灰度分布不均匀，其灰度分布集中在较窄的范围内，使图像的细节不够清晰，对比度较低。通常采用直方图均衡化及直方图规定化两种变换，使图像的灰度范围拉开或使灰度均匀分布，从而增大反差，使图像细节清晰，以达到增强的目的。

直方图规定化：在有些应用中这种自动的增强并不是最好的方法。有时候，需要图像具有某一特定的直方图形状（也就是灰度分布），而不是均匀分布的直方图，这时候可以使用直方图规定化。

形态学操作就是基于形状的一系列图像处理操作。
膨胀就是图像中的高亮部分进行膨胀，“领域扩张”，效果图拥有比原图更大的高亮区域。
腐蚀就是原图中的高亮部分被腐蚀，“领域被蚕食”，效果图拥有比原图更小的高亮区域。
按数学方面来说，膨胀或者腐蚀操作就是将图像（或图像的一部分区域，我们称之为A）与核（我们称之为B）进行卷积。
膨胀就是求局部最大值的操作，核B与图形卷积，即计算核B覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样就会使图像中的高亮区域逐渐增长。
腐蚀就是求局部最小值的操作。

（1）对比度：一副图像中，各种不同颜色最亮处和最暗处之间的差别，差别越大对比度越高，这个跟分辨率没有多少关系，只跟最暗和最亮有关系，对比度越高一个图像给人的感觉就越刺眼，更加鲜亮，突出；越低则给人感觉变化不明显，反差就越小。这个概念只是在给定的图像中，与图像中颜色亮度的变化有关。

（2）亮度：一副图像给人的一种直观感受，如果是灰度图像，则跟灰度值有关，灰度值越高则图像越亮。

（3）饱和度：彩色图像的概念，饱和度为0的话，图像表现为灰度图像；饱和度越高颜色表现出种类越多，颜色表现更丰富，反之亦然。
https://blog.csdn.net/a619774263/article/details/78771083
yuv分别表示
亮度（灰度） y ymin和ymax用于定义对比度（又叫动态范围）；对比度越大，细节越清晰
饱和度 u v

饱和度即原色的纯净度。是色彩远离中性色的距离。
因为一旦不够饱和，则必定存在补色，而补色则会让最小值不为零。
因为，饱和度降低意味着趋向黑白灰，那么RGB三值就趋向于相等。
RGB饱和度的上限就是最低值变为0时的纯色。所以饱和度没有无穷大的说法。

饱和度是否有固定数值？没。首先“饱和度”本身数学定义就很有问题

饱和度是色彩三属性之一（色相H、明度V、饱和度S）HSV
https://www.zhihu.com/question/60487287

离散余弦傅里叶变换 DFT（Discrete Fourier Transform）连续傅里叶变换CFT 快速傅里叶变换FFT
傅里叶变换可以看作是数学上的棱镜，将函数基于频率分解为不同的成分。
https://blog.csdn.net/abcjennifer/article/details/7622228
图像的傅里叶变换是将图像信号分解为各种不同频率的正弦波。同样，小波变换是将图像信号分解为由原始小波位移和缩放之后的一组小波。快速小波变换FWT
https://blog.csdn.net/robin1987z/article/details/49450061

离散余弦变换（英语：discrete cosine transform, DCT）是与傅里叶变换相关的一种变换，类似于离散傅里叶变换，但是只使用实数。
https://zh.wikipedia.org/wiki/%E7%A6%BB%E6%95%A3%E4%BD%99%E5%BC%A6%E5%8F%98%E6%8D%A2

细粒度图像分类
通用图像分类其任务诉求是将“袋鼠”和“狗”这两个物体大类分开，
细粒度图像分类任务则要求对“狗”该类类别下细粒度的子类，即分别为“哈士奇”和“爱斯基摩犬”的图像分辨开来。
https://zhuanlan.zhihu.com/p/24738319

空间域，时域，频域
以时间作为变量所进行的研究就是时域

以频率作为变量所进行的研究就是频域

以空间坐标作为变量进行的研究就是空间域

以波数作为变量所进行的研究称为波数域
https://blog.csdn.net/samkieth/article/details/49561539
时域，空域，频域
傅里叶变换是实现从空域或时域到频域的转换工具。
https://blog.csdn.net/qq_32211827/article/details/78338902

低频对应区域的图像强度变化缓慢，高频对应的变化快。低通滤波器去除了图像的高频部分，高通滤波器去除了图像的低频部分。

低通滤波：每个像素变为相邻像素的平均值，快速的强度变化转化为平缓的过度，如高斯滤波、中值滤波

高通滤波：强调图像中的高频分量，使用高通滤波器进行边缘检测。如Sobel算子是一种经典的边缘检测线性滤波器、方向滤波（导向滤波）、双边滤波、图像的拉普拉斯变换（拉普拉斯滤波）
https://blog.csdn.net/qq_22904277/article/details/53316415

拉普拉斯算子的数学定义：

式（2）为式（1）的数字近似，式（3）中g(x,y)为目标图像，f(x,y)为原始图像。c为1（当掩膜中心系数为正时），c为－1（当掩膜中心系数为负时）
由于laplacian算子是微分操作符，所以它会使图像锐化，并使常量区域为0。
https://blog.csdn.net/wlff_csdn/article/details/51956952

图像锐化(image sharpening)是补偿图像的轮廓，增强图像的边缘及灰度跳变的部分，使图像变得清晰。
锐化后毛刺变多
锐化后轮廓变得清晰，但是轮廓内部或者外部会出现噪声

毛刺

可以看出在“工”字的上面一横中，上边缘有几个突出点，下边缘有两个凹陷点，而在“业”字左侧竖条中有突出点，下面一横中有凹陷点。
https://www.cnblogs.com/stronghorse/p/7224976.html

伪影（Artifacts)是指原本被扫描物体并不存在而在图像上却出现的各种形态的影像。

FFmpeg 开源多媒体框架
https://kuaibao.qq.com/s/20180718A08F6W00?refer=spider
组件（Component）是对数据和方法的简单封装。

建立图像的退化模型即是将图像的降质的机理用数学的方式描述出来，这也是图像去模糊成功的重要因素。
通常来说，图像的退化可以概括为初始的输入图像f(x,y)，经过退化函数k(x,y)作用后，再附加上随机噪声n(x,y)，最后输出为模糊图像g(x,y)。
https://blog.csdn.net/yuyangyg/article/details/78639091

峰值信噪比（PSNR），一种评价图像的客观标准。
PSNR是“Peak Signal to Noise Ratio”的缩写。peak的中文意思是顶点。而ratio的意思是比率或比例的。整个意思就是到达噪音比率的顶点信号，psnr一般是用于最大值信号和背景噪音之间的一个工程项目。
通常在经过影像压缩之后，通常输出的影像都会在某种程度与原始影像不同。为了衡量经过处理后的影像品质，我们通常会参考PSNR值来衡量某个处理程序能否令人满意。它是原图像与被处理图像之间的均方误差相对于(2^n-1)^2的对数值(信号最大值的平方，n是每个采样值的比特数)，它的单位是dB。

PSNR值越大，就代表失真越少。
https://blog.csdn.net/majinlei121/article/details/46779125

psnr = skimage.measure.compare_psnr(im1, im2, 255)

ssim = skimage.measure.compare_ssim(im1, im2, data_range=255)
compare_ssim(X, Y, win_size=None, gradient=False, data_range=None, multichannel=False, gaussian_weights=False, full=False, **kwargs)
https://juejin.im/post/5bf9109ce51d45513d681cd3

图像相似度测量参数有信噪比（SNR）和峰值信噪比（PSNR）等。
信噪比的数值越大，图像质量越好。
https://blog.csdn.net/lien0906/article/details/30059747

超分辨率技术(Super Resolution,SR)

lower level feature 通常是一些pattern，例如，边缘，角，颜色之类的
high level feature 通常有更多的语义信息
https://www.zhihu.com/question/264702008

BMP
BitMap的缩写，是无损的、既支持索引色也支持直接色的、点阵图。

GIF
全称Graphics Interchange Format，采用LZW压缩算法进行编码。是无损的、采用索引色的、点阵图。

JPEG
JPEG是有损的、采用直接色的、点阵图。

PNG-8
PNG全称Portable Network Graphics，PNG-8是PNG的索引色版本。PNG-8是无损的、使用索引色的、点阵图。

PNG-24
PNG-24是PNG的直接色版本。PNG-24是无损的、使用直接色的、点阵图。

SVG
全称Scalable Vector Graphics，是无损的、矢量图。

WebP
WebP是谷歌开发的一种新图片格式，WebP是同时支持有损和无损压缩的、使用直接色的、点阵图。
https://www.zhihu.com/question/20028452

图像增强入门

相关文章

图像对比度增强

color model(颜色模型/色彩模型)

视频质量感知评价指标

视频技术基础

图像分割入门

简单的图像分割

软分割（抠图、二分类分割）

实例分割算法