Python批量增强图像

news/2024/7/21 4:56:43 标签: python, 计算机视觉, 图像处理

Python批量增强图像

基于深度学习的计算机视觉任务,训练模型需丰富的数据集,以提高训练模型的泛化性。当训练数据集图像数量较少时,使用此增强程序批量处理image和mask

图像增强Python程序

python">import cv2
import glob
import numpy as np

def random_crop_flip(inp_img, gt_img):
    """
    随机裁剪和翻转图像
    :param inp_img:一个 HxWxC 输入图像
    :param gt_img:一个 HxW 输入图像
    :return:随机裁剪和翻转的图像
    """
    h, w = gt_img.shape

    rand_h = np.random.randint(h/8)  # / 除
    rand_w = np.random.randint(w/8)
    offset_h = 0 if rand_h == 0 else np.random.randint(rand_h)
    offset_w = 0 if rand_w == 0 else np.random.randint(rand_w)
    p0, p1, p2, p3 = offset_h, h+offset_h-rand_h, offset_w, w+offset_w-rand_w

    rand_flip = np.random.randint(10)  # 返回一个随机整数
    if rand_flip >= 5:
        inp_img = inp_img[::, ::-1, ::]  # [::-1] 反向排序 [:-1] 从位置0到-1之前的数
        out_img = gt_img[::, ::-1]

    return inp_img[p0:p1, p2:p3], gt_img[p0:p1, p2:p3]
    
def random_rotate(inp_img, gt_img, max_angle=25):
    """
    在+max_angle到-max_angle角度内随机旋转图像
    旋转max_angle角度
    :param inp_img:一个 HxWxC 输入图像
    :param gt_img:一个 HxW 输入GT图像
    :param max_angle:图像可以在任意方向旋转的最大角度
    :return:随机旋转的图像
    """
    # angle = np.random.randint(-max_angle, max_angle) # 返回一个随机角度
    angle = max_angle # 旋转max_angle角度
    h, w = gt_img.shape
    center = (w / 2, h / 2)

    M = cv2.getRotationMatrix2D(center, angle, 1.0)  # 给定一个旋转中心点的坐标、旋转角度和缩放因子,返回一个仿射变换矩阵 M
    cos = np.abs(M[0, 0])
    sin = np.abs(M[0, 1])

    #  计算图像的新尺寸并调整旋转矩阵
    new_w = int((h * sin) + (w * cos))
    new_h = int((h * cos) + (w * sin))
    M[0, 2] += (new_w / 2) - center[0]
    M[1, 2] += (new_h / 2) - center[1]

    return cv2.warpAffine(inp_img, M, (new_w, new_h)), cv2.warpAffine(gt_img, M, (new_w, new_h))
    
def random_rotate_lossy(inp_img, gt_img, max_angle):
    """
    在+max_angle到-max_angle角度内随机旋转图像
    旋转max_angle角度
    :param inp_img:一个 HxWxC 输入图像
    :param gt_img:一个 HxW 输入图像
    :param max_angle:图像可以在任意方向旋转的最大角度
    :return:随机旋转的图像
    """
    # angle = np.random.randint(-max_angle, max_angle) # 在+max_angle到-max_angle角度内随机旋转图像
    angle = max_angle # 旋转max_angle角度
    h, w = gt_img.shape
    center = (w / 2, h / 2)
    M = cv2.getRotationMatrix2D(center, angle, 1.0)
    return cv2.warpAffine(inp_img, M, (w, h)), cv2.warpAffine(gt_img, M, (w, h))

def random_brightness(inp_img, gt_img):
    """
    随机扰动输入图像的亮度
    :param inp_img:一个 HxWxC 输入图像
    :return:亮度随机扰动的图像
    """
    contrast = np.random.rand(1) + 0.5  # 返回一个随机数,随机数位于[0, 1)中
    light = np.random.randint(-20, 20)
    inp_img = contrast * inp_img + light

    return np.clip(inp_img, 0, 255), gt_img  # np.clip 将一个nd.array的值限制在给定的上下界, 如果元素值小于下界则将值改为下界值a_min, 同理如果大于上界,则将值改为上界值a_max

def aug(image, mask, image_names, mask_names, k):
    image = cv2.imread(image)
    mask = cv2.imread(mask,0)
    image_rotate, mask_rotate = random_rotate_lossy(image, mask, max_angle=90)
    # image_crop_flip, mask_crop_flip = random_crop_flip(image, mask)
    # image_brigh, mask_brigh = random_brightness(image, mask)
    for image_name in image_names: 
        image_name = image_names[k]
        save_image_path = image_name.split('.')[0]+ '_rotate90'+ '.png'
        cv2.imwrite(save_image_path, image_rotate)
    for mask_name in mask_names: 
        mask_name = mask_names[k]
        save_mask_path = mask_name.split('.')[0]+ '_rotate90'+ '.png'
        cv2.imwrite(save_mask_path, mask_rotate)
    k += 1
        
    
if __name__ == '__main__':
    
    image_path = 'H:/image/train/'  
    mask_path =  'H:/gt/train/' 
    
    image_names = sorted(glob.glob(image_path  + '*.jpg'))
    mask_names = sorted(glob.glob(mask_path  + '*.png'))
    idx = 0
    for picture_name in image_names:
        print(mask_names[idx])
        aug(image_names[idx], mask_names[idx], image_names, mask_names, idx) 
        idx += 1

希望本文对大家有帮助,上文若有不妥之处,欢迎指正。

分享决定高度,学习拉开差距


http://www.niftyadmin.cn/n/755420.html

相关文章

浅谈SSM框架

学习ssm框架(springspringMVCmyBatis)有一段时间了,下面谈谈自己的看法 Spring框架(百科) Spring是一个轻量级的容器框架,它的核心功能是控制反转(IoC)和面向切面(AOP);它就是一个用来生产bean的工厂 轻量级框架优点是减小开发的复杂度,缺点是…

Java学习--点滴记录001

Java概述 1.1 Java是什么? 语言:人与人之间交流的方式 计算机语言:人与计算机之间进行交流沟通的一种特殊语言 Java是一门计算机语言 1.2下载和安装 1.2.1 下载 官方网站下载JDK http://www.oracle.com 本文使用的JDK为 jdk-11.0.10_win…

JVM调优(5)典型配置

原文出处: pengjiaheng 以下配置主要针对分代垃圾回收算法而言。 堆大小设置 年轻代的设置很关键 JVM中最大堆大小有三方面限制:相关操作系统的数据模型(32-bt还是64-bit)限制;系统的可用虚拟内存限制;系统…

C++学习--点滴记录001

1 C初识 1.1 C程序 编写一个C程序总共分为4个步骤 创建项目创建文件编写代码运行程序 1.1.1 创建项目 ​Visual Studio编写C程序的工具,适合小白入门 官网下载安装: Visual Studio官网 1.1.2 创建文件 右键源文件,选择添加->新建项…

C++学习--点滴记录002

2 数据类型 C在创建一个变量或者常量时,必须要指定出相应的数据类型,否则无法给变量分配内存 2.1 整型 作用: 整型变量表示的是整数类型的数据 C中能够表示整型的类型有以下几种方式: 数据类型占用空间取值范围short(短整型)…

无锁的对象引用:AtomicReference

http://www.dewen.net.cn/q/9588 首先volatile是java中关键字用于修饰变量,AtomicReference是并发包java.util.concurrent.atomic下的类。首先volatile作用,当一个变量被定义为volatile之后,看做“程度较轻的 synchronized”,具备…

Java学习--点滴记录002

1. IDEA 1.1 IDEA概述 ​ IDEA全称IntelliJ IDEA,是用于Java语言开发的集成环境 集成环境: ​ 把代码编写,编译,执行,调试等多种功能综合到一起的开发工具 1.2 IDEA的下载和安装 1.2.1 下载 ​ 可以到官方网站下…

vsftp 虚拟用户+MySQL认证独立家目录

centos7 系统 安装包 yum -y install mariadb vsftpd openssl-devel mysql-devel pam-devel yum -y groupinstall "Development Tools" "Server PlatformDevelopment" 启动mariadb 和设置root密码(略) 创建vsftp数据库和用户 CREATE DATABASE vsftpd; …