Deep Homography Estimation for Dynamic Scenes 论文笔记

news/2024/7/21 4:56:48 标签: 其他, 图像处理, 动态规划

Introduction

单应矩阵估计方法(传统+deep learning)

在这里插入图片描述

本文的工作

在这里插入图片描述

auxiliary loss function: compares the dynamic mask from the ground-truth dynamics map that is estimated from the training data.

Related Work

1.Pixel-based approaches

直接搜索使得两张图片对齐误差最小的单应矩阵

已有的误差度量和参数搜索算法(层次估计、傅立叶对齐)能够使得这些方法强大高效。

适用情况: 对缺乏纹理的图像具有鲁棒性,但难以处理 较大运动

2.Feature-based approaches
  1. 使用算法(eg.SIFT and SURF)估计局部特征点
  2. 在两张图片间匹配特征点
  3. 对于一对匹配点,可基于 p 1 = H p 2 p_1=Hp_2 p1=Hp2 求解最小二乘问题来获得最佳单应矩阵

注意: 特征匹配时可能会产生错误,特征点可能会来自移动的对象,因此常使用RANSAC和Magsac等鲁棒估计算法来去除异常值。

适用情况: 该方法的性能取决于局部特征的检测和匹配,不太适用于模糊和缺乏纹理的图像

3.Deep learning approaches

在这里插入图片描述

以上方法 仅基于静态场景下取得成功,没有考虑动态场景

4.本文 multi-scale neural network 的改进
  1. 相较于之前的hierarchical neural network的工作,我们的method从输入图像的低分辨率版本开始,逐渐增加输入图像的大小,而非在每个阶段都以原始输入图像作为input,这使得我们的方法相对于大运动更加稳健。
  2. 相较于之前的Lucas_Kanade layer的工作,我们的method使用前一阶段估计的单应矩阵将输入图像预先对齐到下一阶段,以最小化全局运动。这有助于后期网络解决全局运动
  3. 加入a dynamics mask network来处理动态场景。<之前的neural network-based未考虑的>

Experiments

在这里插入图片描述

评估指标:the mean corner error

e c = 1 4 ∑ j = 1 4 ∣ ∣ c j − c j ^ ∣ ∣ 2 e_c=\frac{1}{4}\sum_{j=1}^{4}||c_j-\hat{c_j}||_2 ec=41j=14cjcj^2

其中, c j c_j cj c o r n e r   j corner\ j corner j 通过estimated homography变换得到的, c j ^ \hat{c_j} cj^ c o r n e r   j corner\ j corner j 通过 ground-truth homography得到的。

训练集的影响

我们分别在动态场景的静态版本和动态版本上训练了homography network

在这里插入图片描述

动态区域大小的影响

在这里插入图片描述

Discussions

Scale selection

An important hyper-parameter of our multi-scale neural network:number of scales

在这里插入图片描述

Real-World videos

在这里插入图片描述

  1. 我们使用合成数据集进行训练,并在NUS stabilization benchmark的video进行了测试
  2. 实验结果显示我们的网络可以很好的应用于真实视频,并且可以通过检查dynamics masks来识别动态内容
Parallx

视差的简单解释:把手指放在据眼睛较近的地方,分别用左右两只眼睛看手指,会发现他们的位置不一样,用数学方式把这个差距计算出来,就是视差。

在上述真实世界的视频中我们发现我们的网络也可以处理视差。

我们在optical flow benchmarks的数据集 Middlebury和Sintel 上进行测试:

  1. 使用我们的method来估计两个帧之间的homography
  2. 使用计算出的homography将这两个帧对齐
  3. 计算两个对齐的帧之间的光流

光流法(optical flow)简介

在这里插入图片描述
(c)中对齐后背景中几乎没有运动,而靠近相机的物体没有对齐,这表明,当我们把foreground objects也当作异常值(像dynamic object一样)去除之后,就能够找到一个homography来处理在尽可能大的区域里的运动。

我们的method就是通过检测 foreground objects 并也把它视作outliers进行处理。

Conclusion

1.收集了一个动态场景的大型视频数据集,并建造了合成数据集
2.开发了一个multi-scale,multi-stage deep neural network
3.用静态的MS-COCO数据集进行训练和测试,可以处理大型全局运动并获得最新的单应矩阵估计结果
4.用我们建造的dynamic-scene dataset训练网络,在一定程度上可以处理动态场景
5.我们的deep homography neural networks可以处理 动态场景、模糊场景、缺乏纹理 等图像。

http://www.niftyadmin.cn/n/735617.html

相关文章

JS基礎:void冷知識

JS 基礎&#xff1a;void 冷知識 文章目錄JS 基礎&#xff1a;void 冷知識簡介參考正文語法Usage 作用ApplicationIIFE(Immediately Invoked Function Expression)箭頭函數結語簡介 今天來介紹一下 JS 規範中超級沒有存在感的運算符&#xff1a;void。啥&#xff1f;聽都沒聽過…

Mac上texstudio无法显示中文字符的问题

笔者近期进行了MacTexTexStudio配置&#xff0c;完成之后发现内置的pdf阅读器中无法显示中文字符&#xff0c;在贴吧中看到一个解决方法&#xff1a; 可以像编译英文一样编译中文&#xff1a;导言区引入包 \usepackage[fontsetmac]{ctex} 示例 \documentclass{article} …

RMAN的备份维护命令

1.validate backupset 指令使用VALIDATE BACKUPSET指令验证备份集的可用性validate backupset 5查看备份集汇总信息list backup summary;2.RESTORE...VALIDATE指令验证表空间SYSAUX备份信息是否在备份集中restore tablespace users validate;验证数据文件是否在备份集中restore…

CSS基礎:Specificity權重(優先級)

CSS 基礎&#xff1a;Specificity 權重 文章目錄CSS 基礎&#xff1a;Specificity 權重簡介參考正文Type 類型引入方法選擇器類型權重計算Level 5Level 4Level 3Level 2Level 1!importantSample結語簡介 前面我已經寫過一個CSS 基礎&#xff1a;Selector 選擇器&#xff0c;介…

Web从入门到放弃8

Ref: Cameron D. - HTML5, JavaScript and jQuery (Programmer to Programmer) - 2015 http://www.runoob.com/svg/svg-path.html MacLees N. - jQuery for Designers Beginner’s Guide - 2012 jQuery for Designers 2014 <1> CSS Responsive box 关键字:display:inli…

RANSAC及其经典变种

序 近年来学者们不断在对经典算法RANSAC进行各种改进&#xff0c;本文想总结一下近年来RANSAC算法的各种改进优化。看到一个写得很好的博客系列&#xff0c;可惜博主没有继续写下去了&#xff0c;很希望博主哪天想起来继续写下去&#xff0c;我暂时在这里做一些简单补充吧&…

CSS進階:Media Query 媒體查詢

CSS 進階&#xff1a;Media Query 媒體查詢 文章目錄CSS 進階&#xff1a;Media Query 媒體查詢簡介參考正文Definition 使用語法Media Type 媒體類型Media Feature 媒體特徵視窗規格(Viewport/Page dimension)Sample顯示品質(Display Quality)色彩(Color)交互能力(Interaction…

Linux wget 命令下载文件

wget是Linux系统中用来下载文件的工具&#xff0c;其功能还是比较多的&#xff0c;能够下载单个文件&#xff0c;也可以分段下载&#xff0c;下面小编将针对wget命令的用法给大家做个实例介绍。 实例1 &#xff1a;下载单个文件 # wget http://mirror.nbrc.ac.in/CentOS/7.0.14…