Scrapy 中 ImagesPipeline 无法保存原图exif信息的原因

之前遇到一个需求，就是需要爬取并下载网站的图片，并带有图片的exif信息，使用了Scrapy， ImagesPipeline 这个处理的pipeline，但是后来发现，这个类有一个大坑，如果是需要下载原图，这个类默认会对图片进行处理，从而覆盖掉原来图片的exif信息，
Scrapy 中 ImagesPipeline 这个类，有一个方法

    def convert_image(self, image, size=None):
        if image.format == 'PNG' and image.mode == 'RGBA':
            background = self._Image.new('RGBA', image.size, (255, 255, 255))
            background.paste(image, image)
            image = background.convert('RGB')
        elif image.mode == 'P':
            image = image.convert("RGBA")
            background = self._Image.new('RGBA', image.size, (255, 255, 255))
            background.paste(image, image)
            image = background.convert('RGB')
        elif image.mode != 'RGB':
            image = image.convert('RGB')

        if size:
            image = image.copy()
            image.thumbnail(size, self._Image.ANTIALIAS)

        buf = BytesIO()
        image.save(buf, 'JPEG')
        return image, buf

会对图片进行一些处理，我就是因为这个坑找了一天，后来不使用这个类自己写的pipeline