【开放集检测OSR】open-set recognition(OSR)开集识别概念辨析

news/2024/7/21 7:28:13 标签: 深度学习, 人工智能, 图像处理, python

开放集学习 Openset Learning
主动学习 Active Learning
例外检测 Out-of-Distribution
open-set recognition(OSR)开集识别
anomaly detection和outlier detection

文章目录

  • OOD检测
  • OSR开放集识别
  • OSR开放集识别在训练和测试阶段的数据集使用
  • 数据分布
  • 似然函数
  • OSR开放集识别的特点
  • OSR 和 OOD detection 的差异:

OOD检测

广义OOD detection:囊括了outlier detection (OD) 离群检测,anomaly detection (AD) 异常检测,novelty detection (ND)新颖检测,open set recognition (OSR)开放集识别 和 OOD detection(OOD)分布外检测;

OSR开放集识别

设计一个模型,这个模型不仅可以对已知的类别进行分类,还能够识别出属于未知类别的样本。这通常需要模型具有一定的异常检测能力。

OSR开放集识别在训练和测试阶段的数据集使用

开放集检测通常会使用闭集图片进行训练,使用开放集图像进行测试。

闭集图片:属于已知类别的样本,它们在训练过程中用于建立模型对这些已知类别的分类能力。闭集训练数据通常包含已知类别的样本和相应的标签,用于指导模型学习正确的类别分类。

开放集图像: 属于已知类别以外、未知或不同类别的样本。这些样本在训练阶段通常不会直接用于模型的训练,因为模型无法从这些样本中获得类别标签信息。开放集图像在测试阶段用于评估模型在处理未知样本时的性能。

开放集检测的目标是识别出不属于任何已知类别的开放集样本,因此训练过程主要关注已知类别的分类能力,而不是对开放集图像进行具体分类的能力。

通常会使用闭集图片训练模型,然后在测试阶段使用开放集图像来评估模型的开放集检测性能。

数据分布

到底什么是深度学习中经常提到的数据分布?

知乎
在这里插入图片描述
如果训练数据是图片的话怎么理解分布的概念?

一幅图像可以认为是一个高维空间中的一个点,多幅图像就是多个点,在高维空间标出来后,会发现这多个点是按照一个分布(不妨假设是一个多维高斯分布)所存在的。一般的正常图像是这个高斯分布中随机采样出来的一个点,而一些噪声图像等非正常图像,它所对应的位置就很可能远离这个高斯分布,或者说计算出来的概率十分低。

在这里插入图片描述

似然函数

概率描述了已知参数时的随机变量的输出结果;似然则用来描述已知随机变量输出结果时,未知参数的可能取值。

例如,对于“一枚正反对称的硬币上抛十次”这种事件,我们可以问硬币落地时十次都是正面向上的“概率”是多少;而对于“一枚硬币上抛十次”,我们则可以问,这枚硬币正反面对称的“似然”程度是多少。

区别似然和概率的直接方法为,"谁谁谁的概率"中谁谁谁只能是事件,也就是,事件(发生)的概率是多少;而"谁谁谁的似然"中的谁谁谁只能是参数,比如说,参数等于某个值时的似然是多少。

OSR开放集识别的特点

【我的理解】
OSR识别是OOD的子集问题,OSR主要侧重于解决语义偏移的问题,而且可以识别出未来会出现的一些新类别,OOD会有语义偏移或者分布偏移等等
OSR还要求模型在已知类别中有好的分类

OSR 和 OOD detection 的差异:

  1. 不同的基准设置: OSR基准通常根据标签类别将一个多类分类数据集拆分为ID(分布内,In- Distribution,ID)和OOD,而OOD检测将一个数据集作为ID,并找到其他几个数据集作为OOD,保证ID / OOD数据集之间的类别不重叠。然而,尽管这两个子任务的基准传统不同,但它们实际上都在处理相同的语义转换检测问题(y变化的检测,作者这里还是认为ood的重点是检测y的变化)。

  2. OSR中没有额外的数据: 由于理论上开放风险约束保证的要求,OSR不鼓励在训练期间通过设计使用额外的数据。这种限制排除了更专注于有效性能改进(例如,异常值暴露)但可能违反OSR约束的方法。

  3. OOD检测的广泛性: 与OSR相比,OOD检测包含更广泛的学习任务(例如,多标签分类)、更广泛的解决方案空间。

OSR与我们的通用OOD检测框架非常吻合,其中"已知的已知类别"和"未知的未知类别"分别对应于ID和OOD。形式上,OSR处理的是OOD样本发生语义偏移(Y变)的情况,即 P ( Y ) ≠ P ′ ( Y ) P(Y) \neq P'(Y) P(Y)=P(Y)。OSR的目标与多类ND的目标在很大程度上是一致的,唯一的区别是OSR额外需要解决一个问题,就是对来自 P ( Y ) P(Y) P(Y) 的ID样本进行准确分类。

例子: MNIST上的一个例子和多类ND类似,将前6类视为ID,其余4类视为OOD。此外,OSR还要求在6个ID类上有一个好的分类器。


http://www.niftyadmin.cn/n/5246750.html

相关文章

Spring Boot 之 ModelFactory

1.initModel 功能&#xff1a; public void initModel(NativeWebRequest request, ModelAndViewContainer container, HandlerMethod handlerMethod)throws Exception {Map<String, ?> sessionAttributes this.sessionAttributesHandler.retrieveAttributes(request);c…

Ubuntu显卡及内核更新问题

显卡安装&#xff08;2023.12.04&#xff09; # 查看显卡型号 lspci | grep -i nvidia # 卸载原nvidia 显卡驱动 sudo apt-get --purge remove nvidia*# 禁用nouveau&#xff08;nouveau是ubuntu自带显卡驱动&#xff09; sudo gedit /etc/modprobe.d/blacklist.conf # 新增2行…

ArcGIS提取路网节点

这是我学校周围的路网,数据就不分享给大家了,看教程知道有这个方法就好了 先打开编辑器,把他合并成只有一个字段的要素 然后打开高级编辑,打断相交线 保存退出,然后打开ArcCatalog 10.6, 建立网络数据集 这时候就成了带有节点的网络数据集,但这还不是我们需要的点文件,因为这…

Android11编译第九弹:openvpn调优

openvpn是一个开源项目&#xff0c;提供vpn 服务功能&#xff0c;可以自己搭建VPN服务器。 https://github.com/schwabe/ics-openvpn.git 集成这个客户端以后&#xff0c;出现一些问题&#xff1a; 问题一.VPN KEY下发失败 问题二&#xff1a;VPN KEY下发成功&#xff0c;但…

倾斜摄影三维重建遇到常见的问题分析

倾斜摄影三维重建遇到常见的问题分析 无人机倾斜摄影免像控点三维重建技术已经在许多领域得到广泛应用&#xff0c;包括土地测绘、城市规划、文化遗产保护等。然而&#xff0c;在实际应用中&#xff0c;仍然会遇到一些常见问题和挑战。本文将针对这些问题进行分析&#xff0c;并…

探索Vue小程序框架的底层原理

最近晚上有时间复盘之前研究小程序框架的相关内容&#xff0c;总结文章记录一下。 本篇文章主要介绍百度19年开源的Mars小程序开发框架&#xff0c;和Taro、mpvue、uniapp类似&#xff0c;都是编译型小程序框架&#xff0c;都是通过将 Vue 或 React 源码直接编译为小程序源码&a…

ReactNative性能优化实践

ReactNative 性能优化主要分为以下几个方面&#xff1a; **减少 re-render&#xff1a;**re-render 是 React 的核心概念&#xff0c;也是性能优化的重点。re-render 会导致组件树重新渲染&#xff0c;这会消耗 CPU 和 GPU 资源。因此&#xff0c;减少 re-render 是提升性能的…

智能优化算法应用:基于金枪鱼群算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用&#xff1a;基于金枪鱼群算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用&#xff1a;基于金枪鱼群算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.金枪鱼群算法4.实验参数设定5.算法结果6.参考…