python图像填充与裁剪/resize的实现代码_F11 - 专业站长和开发者的学习网站

分享到

python图像填充与裁剪/resize的实现代码

python 来源：互联网作者：佚名发布时间：2022-09-03 06:56:26 人浏览

摘要

前言有时候我们需要把图片填充成某个数字的整数倍才能送进模型。例如，有些模型下采样倍率是8倍，或者16倍，那么输入的长和高就分别应该是8或16的整数倍。如果图片达不到，除

前言

有时候我们需要把图片填充成某个数字的整数倍才能送进模型。
例如，有些模型下采样倍率是8倍，或者16倍，那么输入的长和高就分别应该是8或16的整数倍。如果图片达不到，除了拉伸图像(会造成比例改变），另一种就是先填充，后裁剪。
相信搞过NLP的同学并不陌生啦。

代码

from math import ceil

from torchvision.transforms.functional import to_tensor, to_pil_image

from PIL import Image

import torch

# 填充到最接近base整数倍的长和宽图像大小

def get_padding_pic_mask(origin_png, result_png, result_mask_png, rgb=[[130, 206, 255]], base=4):

# C, H, W

src = Image.open(origin_png)

src = to_tensor(src)

# print(src.shape) # torch.Size([3, 800, 600])

# channel: (R, G, B) / 255

origin_h, origin_w = src.shape[1], src.shape[2]

print('原图像大小, height: {}, width: {}'.format(origin_h, origin_w))

h = ceil(origin_h / base) * base

w = ceil(origin_w / base) * base

img = torch.ones(3, h, w)

# 如果想要填充是黑色则注释掉上一句，换下面这一句

# img = torch.zeros(3, h, w)

img[:, :origin_h, :origin_w] = src

# 保存填充后的图片

to_pil_image(img).save(result_png)

# 处理一下mask

mask = torch.tensor(rgb) / 255

mask = mask.view(3, 1, 1).repeat(1, h, w)

# 保存填充后的mask

to_pil_image(mask).save(result_mask_png)

# 图像输出后我们需要clip一下

def clip_unpadding(input_png, output_png, origin_h, origin_w):

# C, H, W

img = Image.open(input_png)

img = to_tensor(img)

img = img[:, :origin_h, :origin_w]

# 保存裁剪后的图片

to_pil_image(img).save(output_png)

if __name__ == '__main__':

# origin_png = 'pic/pic.jpg'

# result_png = 'pic/pic_padding.jpg'

# result_mask_png = 'pic/mask_padding.jpg'

# get_padding_pic_mask(origin_png, result_png, result_mask_png)

input_png = 'pic/pic_padding.jpg'

output_png = 'pic/pic_clip.jpg'

# 原图像大小, height: 567, width: 390

clip_unpadding(input_png, output_png, 567, 390)

自媒体培训

resize

有时候我们也要改变图片的宽和高。

from PIL import Image

def resize_img(origin_png, resize_png, height, width):

img = Image.open(origin_png)

img = img.resize((width, height))

img.save(resize_png)

if __name__ == '__main__':

origin_png = 'pic/white.jpg'

resize_png = 'pic/white_resize.png'

resize_img(origin_png, resize_png, 800, 600)

您可能感兴趣的文章 :

原文链接 : https://blog.csdn.net/weixin_43850253/article/details/126445783

Tag : python(762)裁剪(5)填充(3)

Python Django教程之实现新闻应用程序

Django是一个用Python编写的高级框架，它允许我们创建服务器端Web应用程序。在本文中，我们将了解如何使用Django创建新闻应用程序。我们将
书写Python代码的一种更优雅方式(推荐!)

一些比较熟悉pandas的读者朋友应该经常会使用query()、eval()、pipe()、assign()等pandas的常用方法，书写可读性很高的「链式」数据分析处理代码
Python灰度变换中伽马变换分析实现

1. 介绍伽马变换主要目的是对比度拉伸，将图像灰度较低的部分进行修正伽马变换针对的是对单个像素点的变换，也就是点对点的映射形
使用OpenCV实现迷宫解密的全过程

一、你能自己走出迷宫吗？如下图所示，可以看到是一张较为复杂的迷宫图，相信也有人尝试过自己一点一点的找出口，但我们肉眼来解谜
Python中的数据精度问题的介绍

一、python运算时精度问题 1.运行时精度问题在Python中（其他语言中也存在这个问题，这是计算机采用二进制导致的），有时候由于二进制和
Python随机值生成的常用方法

一、随机整数 1.包含上下限：[a, b] 1 2 3 4 import random #1、随机整数：包含上下限：[a, b] for i in range(10): print(random.randint(0,5),end= | ) 查看运行结
Python字典高级用法深入分析讲解

一、 collections 中 defaultdict 的使用 1.字典的键映射多个值将下面的列表转成字典 l = [(a,2),(b,3),(a,1),(b,4),(a,3),(a,1),(b,3)] 一个字典就是一个键对
Python浅析多态与鸭子类型使用实例

什么多态：同一事物有多种形态为何要有多态=》多态会带来什么样的特性，多态性多态性指的是可以在不考虑对象具体类型的情况下而直
Python字典高级用法深入分析介绍

一、 collections 中 defaultdict 的使用 1.字典的键映射多个值将下面的列表转成字典 l = [(a,2),(b,3),(a,1),(b,4),(a,3),(a,1),(b,3)] 一个字典就是一个键对
Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本

我们的目标是秒杀淘宝或京东等的订单，这里面有几个关键点，首先需要登录淘宝或京东，其次你需要准备好订单，最后要在指定时间快速