计算机视觉模型效果不佳，你可能是被相机的Exif信息坑了

2024-08-06 18:26:22

视觉/图像重磅干货，第一时间送达

新机器视觉

最前沿的机器视觉与计算机视觉技术

206篇原创内容

公众号

本文转载自：AI新媒体量子位

为何别人用得好好的人脸识别、目标检测开源模型，到了初学者手中，效果却惨不忍睹？其中原因可能很多，有时候这个原因很“愚蠢”。

最近一位Medium上的博主Adam Geitgey给初学者指出了一个极其简单而又容易忽视的关键点：相机的Exif信息。

在开发和使用计算机视觉（CV）模型的过程中，由于NumPy、TensorFlow和电脑上的图片查看器在处理Exif上存在着差异，让这个问题变得十分隐秘。

Adam是一位知名的机器学习课程博主，他的博客内容非常实用，几乎篇篇都能收获上千赞，足见其受欢迎的程度。

他在最新的文章中指出了CV模型在处理Exif存在的缺失，以及补救方法，下面是他文章的主要内容。

Exif信息害死人

普通智能手机或者相机拍照时，如果手持方向发生变化，内部的重力感应器件会告诉设备，照片究竟哪个边是向上的。

当我们在手机、相机或者电脑的Photoshop软件上查看照片时，完全没有问题，就像这样：

然而眼见并非为实，实际图像的像素数据不会旋转。这是由于图像传感器是对连续的像素信息流进行逐行读取，因此你无论纵向和横向握持相机，图像都是按照一个方向进行存储。

那么拍照设备和电脑为什么就能按照正确的方向显示图片呢？这是因为照片里还保存着一组元数据，称之为Exif，即可交换图像文件格式（Exchangeable image file format）。

Exif中包含着照片的像素数、焦距、光圈等信息，其中还有一个方向（Orientation）的数据。

上图中Orientation一项的参数是Rotate 90 CW，意思是图像在显示前需要顺时针旋转90度。如果图片查看程序没有执行此操作，你就只能拧着脖子看了。

Exif原先是用在TIFF图像格式上，后来才加入到JPEG图像格式中，而图像数据集中的图片大多是JPEG格式。

一些程序为了保持向后兼容性，不会去解析Exif数据。大多数用于处理图像数据的Python库（如NumPy、SciPy，TensorFlow，Keras等）就是这样的。

这意味着当你使用这些工具导入图像时，都将获得原始的未旋转图像数据。如果把这些侧躺着或上下颠倒的图像输入到CV模型中，会得到错误的检测结果。

这个问题看起来很愚蠢，似乎初学者会犯这样的低级错误。但事实并非如此！甚至连Google云上的视觉API Demo也无法正确处理Exif方向问题：

如果我们把图像旋转到正确的方向再上传，检测的结果与上图相比将完全改变：

当我们在电脑上查看图片时完全没问题，但是一用到模型中就不正常。因此很难发现问题的所在。

这也导致一些开发者在Github上提问，抱怨他们正在使用的开源项目已损坏，或是模型不够准确。但是实际上问题要简单得多，只是图片的方向错了！

解决方法

解决以上问题的方法就是，在导入图像时检查它们的Exif数据，在必要时旋转图像。Adam已经写好了一段代码：

import PIL.Image

import PIL.ImageOps

import numpy as np
def exif_transpose(img):

    if not img:

        return img
exif_orientation_tag = 274
# Check for EXIF data (only present on some files)

    if hasattr(img, '_getexif') and isinstance(img._getexif(), dict) and exif_orientation_tag in img._getexif():

        exif_data = img._getexif()

        orientation = exif_data[exif_orientation_tag]
# Handle EXIF Orientation

        if orientation == 1:

            # Normal image - nothing to do!

            pass

        elif orientation == 2:

            # Mirrored left to right

            img = img.transpose(PIL.Image.FLIP_LEFT_RIGHT)

        elif orientation == 3:

            # Rotated 180 degrees

            img = img.rotate(180)

        elif orientation == 4:

            # Mirrored top to bottom

            img = img.rotate(180).transpose(PIL.Image.FLIP_LEFT_RIGHT)

        elif orientation == 5:

            # Mirrored along top-left diagonal

            img = img.rotate(-90, expand=True).transpose(PIL.Image.FLIP_LEFT_RIGHT)

        elif orientation == 6:

            # Rotated 90 degrees

            img = img.rotate(-90, expand=True)

        elif orientation == 7:

            # Mirrored along top-right diagonal

            img = img.rotate(90, expand=True).transpose(PIL.Image.FLIP_LEFT_RIGHT)

        elif orientation == 8:

            # Rotated 270 degrees

            img = img.rotate(90, expand=True)
return img
def load_image_file(file, mode='RGB'):

    # Load the image with PIL

    img = PIL.Image.open(file)
if hasattr(PIL.ImageOps, 'exif_transpose'):

        # Very recent versions of PIL can do exit transpose internally

        img = PIL.ImageOps.exif_transpose(img)

    else:

        # Otherwise, do the exif transpose ourselves

        img = exif_transpose(img)
img = img.convert(mode)

return np.array(img)

加入以上代码后，就可以正确地将图像导入Keras或TensorFlow了。

如果觉得麻烦，Adam还把上面的代码打包好了，在GitHub上这个项目叫做image_to_numpy。一行代码就可以完成安装：

pip3 install image_to_numpy

以后，你在自己的Python代码中加入这样几句即可。

import matplotlib.pyplot as pltimport image_to_numpy# Load your image fileimg = image_to_numpy.load_image_file('my_file.jpg')# Show it on the screen (or whatever you want to do)plt.imshow(img)plt.show()

传送门

快速导入旋转图像的image_to_numpy：

https://github.com/ageitgey/image_to_numpy

《计算机视觉》中的几何变换：Python示例的直观解释

重磅干货,第一时间送达图片由Payton Tuttle在Unsplash提供几何变换是任何图像批量处理中最常见的变换操作之一.在今天的文章中,我们将讨论其中的三种变换:旋转.平移和缩放,然后仅仅使 ...
python 读取并显示图片的两种方法

在 python 中除了用 opencv,也可以用 matplotlib 和 PIL 这两个库操作图片.本人偏爱 matpoltlib,因为它的语法更像 matlab. 一.matplotlib 1. ...
【AI基础】OpenCV，PIL，Skimage你pick谁

汤兴旺就读于吉林大学汽车工程学院,计算机视觉爱好者,言有三弟子作者 | 汤兴旺编辑 | 汤兴旺/言有三如何对图像进行处理是深度学习图像处理的基础,我们常常需要对图像进行读取.保存.缩放.裁剪. ...
【AI-1000问】为什么OpenCV读取的图像格式是BGR？

为什么OpenCV存储的图像格式是BGR呢? 做图像处理的我们应该都知道,OpenCV是我们必备的一个工具,我们在使用OpenCV读取图像时你应该也发现了读取出来的数组居然是BGR格式,而不是我们听的 ...
如何在机器学习中应用图像处理以及使用相对于的技术

Processing 可以用来提高图像质量,或帮助你从图像中提取有用的信息.它在医学成像等领域很有用,甚至可以用于隐藏图像中的数据. 在本文中,我将告诉你有关如何在机器学习中应用图像处理以及可以使用的 ...
常见的图像处理技术

重磅干货,第一时间送达本期文章中,让我们一起来学习以下内容. 通过PIL和OpenCV来使用一些常见的图像处理技术,例如将RGB图像转换为灰度图像.旋转图像.对图像进行消噪.检测图像中的边缘以及裁剪 ...
用微信拍照，别用自带相机，用这个方法既能美颜又可以直接发送

用微信拍照，别用自带相机，用这个方法既能美颜又可以直接发送
单反丨这些相机自带的调色参数，让原片不修都超美！

摸起单反后你会发现,不是每个会用单反拍照的人都会修图.那么我们如何在不使用后期的情况下,用相机直出的照片色彩能保证好看呢? 其实不同的调色参数会给你带来不同的惊喜,我们在网上找到了一位摄影师分享的GR ...
运维必知必备！73页计算机基础知识，新手小白也能轻松读懂

基础不牢,地动山摇! 新手在学习运维亦或是开发的时候,都要注重基础知识的积累,不能只想着学习实战知识,这样到中后期,容易造成对"高级知识点"的一知半解,以至于知其然,却不知其所以然 ...
这9个相机调色参数，让你原片直出就美爆！

大家好,今天小编分享的是来自摄影师霜绝的GR2御用调色参数,用好这9个调色参数,原片直出都会非常好看喔. 御用参数1-蓝色暗调由于环境光不同,这里需要按环境光调整白平衡,一般设置在CT色温的 ...
这11所大学计算机专业堪称国内顶级，2021考生千万不要错过

计算机专业近几年一直热度超高,是很多考生和家长的首选,今天学科竞赛网就为大家盘点一下目前国内计算机专业比较好的大学,一起来看: 01 第四轮计算机科学与技术学科评估结果 02 计算机专业详细介绍计算 ...
巧妙设置相机参数，应用不同的景别，拍出梦幻缥缈的云雾

我们都知道雾是由许多细小的水滴组成的,它能反射大量的散射光.距离愈远,散射光越多,看上去越明亮,远处景物越看不清.所以在薄雾笼罩下的景物,更能明显地区分出前景.中景.远景,空间的纵深感很强.而且薄雾也 ...
4月下半月相机销量排行榜 EOS R5重夺第一、神秘单反上榜

2021年5月8日,CAPA CAMERA WEB公布了日本电器销售平台友都八喜(Yodobashi)4月下半月相机销量排行榜.本期最大的新闻并非佳能EOS R5重回榜首,而是友都八喜榜单上终于有单反 ...
特发性水肿吃药效果不佳按压身体这个穴位可有效消肿

特发性水肿吃药效果不佳按压身体这个穴位可有效消肿
看完这些作品，我把相机砸了！

日本画家毛利太佑超写实素描作品貌似要逼屎人的节奏西班牙艺术家Juan Francisco Casas 圆珠笔的画作看起来也挺洋气的像加了某种特效的素描. 画看完了小编去砸相机了 ~~~ [版权 ...

计算机视觉模型效果不佳，你可能是被相机的Exif信息坑了

本文转载自：AI新媒体量子位

相关推荐