计算机视觉 Computer Vision Chaper9 目标检测 上

文章目录

  • 目标检测
  • ILSVRC竞赛
  • 区域卷积网络R-CNN系列
    • R-CNN
    • SPP-NET
    • Fast R-CNN
    • Faster R-CNN

目标检测

在这里插入图片描述
在这里插入图片描述

ILSVRC竞赛

在这里插入图片描述

区域卷积网络R-CNN系列

在这里插入图片描述
在这里插入图片描述
两个步骤:1)提取物体区域;2)对区域进行分类识别;
本章所有模型都基于这个思想。但是YOLO不是。

R-CNN

在这里插入图片描述
找到2000个可能出现物体的区域,然后对所有区域进行warped region标准化,变成正方形。第3步就是CNN卷积神经网络,提取特征。第4步是放入SVM进行分类+回归Bounding box regression。
在这里插入图片描述
如黄色小猫咪,通过无数个红色小方框,不断地将相似度高的框进行合并,最终形成的绿色框,就是需要进行识别的区域。
selective search只是将有物体的区域找出来,没有任何语义信息。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
ground-truth 真实的,专家标注的。负样本就是没有被框住的。
在这里插入图片描述
数据量少时,只训练绿色层就可以了,数据量大,绿色层和上面的3层橘色的一起训练。
在这里插入图片描述
每一个类别,有一个自己的SVM。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
P的IoU>0.6的意思是:只有P和G差不多,才做校正。差很多的都不考虑了。
在这里插入图片描述
在这里插入图片描述
PR曲线随着阈值的改变,曲线也会改变。因为它是Precision和Recall组成的。mAP是因为我们有20个类别,我们要把这20个AP加起来再取平均值,才是mAP。
在这里插入图片描述

SPP-NET

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Fast R-CNN

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
smooth做x的判断,x>1的话,可能是异常值,所以这个时候就不用平方了,直接绝对值减去0.5.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Faster R-CNN

RON(Region Proposal Network)区域建议网络取代SS。其他部分和Fast R-CNN一样。提供的建议区域变少了,300张。框的也更准了。它是训练出来的。
在这里插入图片描述
在这里插入图片描述
注意那里是Conv5的feature map。不是原始图片。
在这里插入图片描述
在这些anchor box的基础上,做RON。
在这里插入图片描述


http://www.niftyadmin.cn/n/1207845.html

相关文章

富文本编辑器实现一键导入pdf

图片的复制无非有两种方法,一种是图片直接上传到服务器,另外一种转换成二进制流的base64码 目前限chrome浏览器使用 首先以um-editor的二进制流保存为例: 打开umeditor.js,找到UM.plugins[autoupload],然后找到autoUpl…

高可用网站的软件质量保证

高可用网扎的软件质量保证1、网站发布(局部发布)2、自动化测试(selenium)3、预发布验证4、代码控制(分支开发,主干发布)5、自动化发布(周四发布)6、灰度发布(AB测试)7、网站运行监控a、监控数据…

剑指offer 刷题 七 搜索与回溯(26 27 28)

剑指 Offer 26. 树的子结构 输入两棵二叉树A和B,判断B是不是A的子结构。(约定空树不是任意一个树的子结构) B是A的子结构, 即 A中有出现和B相同的结构和节点值。 递归: def isSubStructure(self, A: TreeNode, B: TreeNode) -> bool:def…

富文本编辑器实现导入word

1.4.2之后官方并没有做功能的改动,1.4.2在word复制这块没有bug,其他版本会出现手动无法转存的情况 本文使用的后台是Java。前端为Jsp(前端都一样,后台如果语言不通得自己做 Base64编码解码) 因为公司业务需要支持IE8…

树莓派的rc.local档(设置开机)

为了树莓派执行命令或程序时启动。需要被添加到顺序rc.local档。这是为那些谁执行后,直接要权力树莓派没有配置。或者不希望每次都手动启动该程序很实用。的方法是使用cron和crontab。 EDITING RC.LOCAL(编辑rc.local文件) 在你的树莓派上&am…

富文本编辑器实现导入PowerPoint

百度ueditor新增的将word内容导入到富文本编辑框的功能怎么没有啊,... ueditor实现word文档的导入和下载功能的方法:1、UEditor没有提供word的导入功能,只能说是粘贴复制。 2、方案:用poi来提供word导入,思路是将word转换为html…

Video-No.03 韩顺平_MySQL优化

2019独角兽企业重金招聘Python工程师标准>>> 1、MySQL数据库优化技术 1)表的设计合理化(符合3NF) 2)添加适当的索引(index):普通索引、主键索引、唯一索引、全文索引、复合索引 3&am…

计算机视觉 Computer Vision Chaper10 目标检测 下

文章目录区域卷积神经网络(R-CNN)系列R-FCNYOLO系列YOLO V1YOLO V2/9000YOLO V3人脸检测和行人检测基于Darknet的YOLO实现区域卷积神经网络(R-CNN)系列 R-FCN 区域-全卷积网络 检测网络是回归,分类网络是分类。全连接层fully connect后,相对位置就丢失…