无损放大图片和视频?这两款AI工具值得拥有
作为编辑,除了文本工作的主要工作内容外,我们经常需要考虑一个非常重要的问题:插图。
当然,所有文本文章都不会以图形和文本的形式吸引人们的注意力,更不用说这段视频当权的时代了。因此,每次我写一篇文章时,作者都应该仔细选择无版权图片网站上的图片,使图片符合文章的主题,最好使用高分辨率的图片。
然而,事故总是有的。有时人们会遇到分辨率不够但最合适的图像,这非常令人沮丧。直接将低分辨率图像插入到文章中会明显感到视觉不适。虽然PS甚至windows提供的绘图工具都可以修改图像分辨率,但强制拉伸的结果只会使图像变得非常模糊。
可以看出,拉伸图片后,图片边缘出现了明显的毛刺。
有没有办法无损放大这张照片?
不要说,这是真的。GitHub的这个项目“AndyLau”可以做到这一点。
项目地址为https://github.com/nagadomi/waifu2x,有兴趣的朋友可以研究一下。网址是http://AndyLau.udp。jp/
少说闲话。下面是使用waifu2x和普通拉伸图片(左侧拉伸和右侧使用waifu2x)的比较。
可以看出,使用waifu2x放大图片后,“5g”边缘的毛刺感不再明显。虽然某些地区仍然存在噪音问题,但总的来说,它比直接拉伸要好得多。
那为什么waifu2x可以无损地放大照片呢?这是因为waifu2x使用了一种称为srcnn的卷积算法。传统上,图像超分辨率问题研究的是如何在输入低分辨率图像(LR)时获得高分辨率图像(HR)。
传统的图像插值算法,如最近邻插值、双线性插值、双三次插值等都能在一定程度上达到这种效果,但这些算法获得的高分辨率图像效果并不理想。
Srcnn是第一个使用cnn结构(即基于深度学习)的端到端超分辨率算法。采用深度学习的方法实现了整个算法过程,其效果优于传统的多模块集成方法。
Sr-cnn过程如下:首先,输入预处理。通过双三次算法将输入的低分辨率LR图像放大到目标尺寸。
然后,该算法的下一个目标是通过对输入的模糊LR图像进行卷积网络处理,得到超分辨率SR图像,使其尽可能与原始图像的高分辨率HR图像相似。
与双三次、SC、NE+LLE、KK、anr和a+相比,srcnn在大多数指标上表现最好,恢复速度也处于前列,RGB频道的联合训练效果最好,这意味着与照片相比,waifu2x在放大插图(您最喜欢的二次图片)方面会有更多优势。
对于srcnn卷积算法,您可以转到https://arxiv.org/abs/1501.00092了解更多。
既然图片可以无损放大,那么视频呢?
结果当然是可行的,但是这次使用的工具,它被称为Topazgigapixel视频AI。该软件通过数千个视频进行训练,结合来自多个输入视频帧的信息,通过真实细节和运动一致性将视频放大到8K分辨率。
作为一种人工智能软件,它需要一台速度快的计算机。建议的系统配置为32GBram加上具有6GB或更大内存的NVIDIA图形卡。虽然它只能在旧电脑上运行,但速度会非常慢。
Topazgigapixel视频AI如何放大视频?事实上,在安装软件时,您会发现tensorflow库和cudnn库将被安装。因此,很明显,软件使用基于深度学习的卷积神经网络来处理每一帧,并在整个过程中运行CUDA单元(否则不会太慢)。
熟悉图形卡的老朋友都知道,图形卡作为计算机主机的重要组成部分,是计算机进行数模转换的设备,承担着图形输出和显示的任务。
图形卡连接到计算机主板。它将计算机的数字信号转换为模拟信号进行显示。同时,图形卡还具有图像处理能力,可以辅助CPU,提高整体运行速度。对于从事专业平面设计的人来说,图形卡是非常重要的。
民用和军用图形芯片供应商主要包括AMD和NVIDIA(英特尔今年也将加入混沌战争)。
GPU的组成相对简单。有大量的计算单元和超长的流水线。它特别适用于处理大量类型的统一数据,如矩阵乘法和加法。因此,图形卡在人工智能领域的应用变得非常广泛。CUDA是NVIDIA推出的一个并行计算框架,它只能用于自己的GPU。
只有安装这个框架,才能进行复杂的并行计算。主流的深度学习框架是基于CUDA的GPU并行加速,tensorflow也不例外。
不幸的是,用于视频的topaz千兆像素AI的价格仍然相对昂贵。近200美元的价格可以说服许多人,但它对修复或修复一些古代电影和电视作品非常有用。现在,可以在站点B上搜索的[4K修复]视频中有相当一部分是基于该软件制作的。
现在想想,人工智能的出现确实解决了生活中的许多实际问题。没有卷积神经网络的快速发展,观看高清再现的古代影视作品可能只存在于想象中。
© 本文系原创,著作权归:芦虎导航官网。如需转载,请署名并注明出处:https://www.luhu.co/article/000000000013059.shtml