2D图片“脑补”3D 这次真的只用一张图就行了

互联网＋

2022-03-02 16:00:01

芦虎导航官网

2D图片“健脑”3D模型，这次真的只使用一张图片--

只需随机给AI提供一张照片，它就可以从不同角度为您生成“新视图”：

不仅如此360有学位的椅子和汽车，甚至人脸，也玩了新把戏，可以从“死亡自拍”的角度到底图生成：

更有趣的是，这个名为pix2nerf的人工智能与训练数据集有点“不同”。它可以学习在没有3D数据、多视角或相机参数的情况下生成新的视角。

可以说，它将nerf系列的人工智能推向了一个新的高度。

使用Gan+自动编码器学习“健脑”

在此之前，nerf可以通过多视图训练AI模型，使其学会从新视角生成3D对象照片。

然而，这也导致了一系列使用nerf方法的模型，包括像素nerf和GRF，它们需要使用多视图数据集来训练更好的2D以生成3D模型效果。

多视图数据集通常是有限的，而且训练时间很长。

因此，作者提出了一种新的方法，即使用自动编码器提取物体的姿势和形状特征，然后直接生成新的透视图像。

Pix2nerf包括三种网络结构，即生成网络G、鉴别网络D和编码器E。

其中，生成网络G和判别网络D形成生成对抗网络Gan，编码器E和生成网络G用于形成自动编码器：

首先，通过无监督学习，自动编码器可以获得输入图像的隐藏特征，包括物体姿态和形状，并利用学习到的特征重构原始数据；

然后，通过姿态和形状数据，使用Gan重建与原始物体形状不同的新视图。

在这里，研究人员使用了一种称为π-Gan的结构，它比其他类型的Gan能更好地生成3D透视照片（作者还比较了一篇使用hologan的论文）：

那么，这种“混合”人工智能模型的效果如何？

还可以通过粘贴图片生成新的透视图

作者首先进行了一系列消融实验，以验证不同的训练方法和模型架构是否真的能改善pix2nerf的效果。

例如，移除模型的Gan反向映射和自动编码器，或者不要使用预热来预热学习速率，然后尝试生成具有新视角的人脸：

其中，Gan反演的目的是将给定的图像反转回预先训练好的Gan模型的势空间，以便生成器可以根据反演代码重建图像。

实验表明，除完整模型外，去除各种方法的模型生成人脸的效果不够好。

然后，作者将生成照片的效果与生成新视图的其他人工智能模型进行了比较。

结果表明，虽然pix2nerf在shapenetJetLi的生成效果上不如pixelnerf，但效果也相对接近：

在CelebA和卡拉的数据集上，pix2nerf基本上取得了最好的结果。

此外，该模型还具有一些“美容”功能，即使发送了粘贴图片，也可以为Gan提供更平滑的轮廓：

总的来说，除了从不同角度生成新的视图外，对象也可以由大脑构成360在°

人工智能似乎和人类一样，已经学会了“大脑填充”他们从未见过的物体的形状。

作者简介

本文作者来自苏黎世联邦理工学院（ETH）。

第一篇论文是eth硕士蔡胜渠，他毕业于伦敦国王学院。他的研究兴趣是神经渲染、生成模型和无监督学习。他高中毕业于辽宁实验中学。

eth博士生安东·奥布霍夫曾在英伟达和其他公司工作，他的研究方向是计算机视觉和机器学习。

马普切研究所高级研究员、eth（外部）讲师戴登新专注于有限监督下的自动驾驶、传感器融合和目标检测。

Lucvangool是eth的计算机视觉教授。谷歌的学术参考文献已经达到15W+，其研究方向主要是2D和3D对象识别、机器人视觉和光流。

目前，这项研究的代码仍在编制中。

感兴趣的伙伴可以蹲一会儿~

论文地址：https://arxiv.org/abs/2202.13162

项目地址：https://github.com/sxyu/pixel-nerf

参考链接：

[1]https://arxiv.org/pdf/2102.03285.pdf

[2]https://arxiv.org/pdf/2012.02190.pdf

[3]https://www.mpi-inf.mpg.de/departments/computer-vision-and-machine-learning

[4]https://www.linkedin.com/in/shengqu-cai-818230185/

标签：#人工智能##3d##gan##模型##Gan##研究##D##eth#

下一篇：魏牌CEO：长城DHT混联技术“秒杀“蔚小理

上一篇：《艾尔登法环》1.02补丁次世代主机版评测：XSS、PS5难稳60帧

相关资讯推荐关键词：人工智能,3d,gan,模型,Gan,研究,D,eth

AI大模型“国家队”来了！华为、百度等6家公司联合参与

芦虎导航7月7日消息，今天，在WAIC 2023世界人工智能大会期间，国家人工智能标准化总体组，公布了我国首个大模型标准化专题组的组长单位名……

5个新兴人工智能物联网应用

人工智能与物联网的结合，这种新技术浪潮可以带来新的机遇，并改变整个行业的运营方式。以下汇总了5个新兴人工智能物联网应用……5个新兴人工智能物……

快20倍！谷歌AI推TensorFlow 3D，智能汽车好用

Google AI发布了TensorFlow 3D，将3D深度学习能力引入TensorFlow，加入3D稀疏卷积网络，在Waymo Open……

国内大模型和ChatGPT差距到底多大？权威学者：一半时间

2023年，世界正处于人工智能发展的快车道上，各行各业都在寻求通过人工智能技术实现转型升级。然而，与此同时，人工智能的安全性问题也受到各方的……

教育部再增37个高校新专业，人工智能类占1/3

近年来，要论科技领域什么词汇最为火热?5G、人工智能等无疑榜上有名。当前，虽然5G的势头暂时压过人工智能一筹，但后者的发展与热度也丝毫未减。……

抖音：ChatGPT等人工智能生成内容要显著标识并负责

快科技5月9日消息，在内容创作领域，生成式人工智能技术降低了创作的门槛，丰富了互联网内容生态。但与此同时，人工智能生成内容存在识别难的特点，……

2D图片“脑补”3D 这次真的只用一张图就行了

2D图片“健脑”3D模型，这次真的只使用一张图片--只需随机给AI提供一张照片，它就可以从不同角度为您生成“新视图”：不仅如此360有学位的……

全球首个知识增强千亿大模型百度·文心发布全景图首次亮相

12月8日，鹏城实验室与百度联合召开发布会，正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心（模型版本号：ERNIE 3……

新华社：百度文心一言综合排名国内第一智商超过ChatGPT 3.5

芦虎导航6月10日消息，近日，新华社研究院中国企业发展研究中心对主流大模型产品进行了体验评测，发布了《人工智能大模型体验报告》。《报告》显示……

谷歌AI部门动荡升级：伦理AI负责人遭解雇曾声援离职传奇研究员

北京时间2月20日早间消息，据报道，谷歌刚刚解雇了公司伦理人工智能（Ethical Artificial Intelligence）负责人麦……

百度：AIGC创新是颠覆式的我们要做超前点播

芦虎导航5月25日消息，AI人工智能技术最近成为热点，各大科技厂商都下场搞自己的AI大模型，百度也推出了文心一言对决ChatGPT这样的AI……

SA：2021年全球售出的所有智能手机中有71％将具有设备端AI

3月12日消息，Strategy Analytics近期发布的研究报告《智能手机：全球人工智能技术预测至2025年》指出，智能手机……

Meta豪购25亿元NV安培GPU 打造世界级AI超算：性能怪兽来了

最近，meta（Facebook母公司）宣布建造世界上最强大的人工智能超级计算机，称为人工智能研究超级集群（AIresearchsuperc……

Google气球的人工智能为何令开发者自己感到惊奇？

北京时间3月5日消息，使用人工智能的算法正在尝试以意想不到的技巧来解决问题，这让它们的开发者感到惊讶。但与此同时，这也引发了人们对如何控制人……

谷歌气球的人工智能为何令开发者自己感到惊奇

北京时间 3 月 5 日消息，使用人工智能的算法正在尝试以意想不到的技巧来解决问题，这让它们的开发者感到惊讶。但与此同时，这也引发了人们对如……

大厂员工也不安全！微软半数员工担心被AI取代

日前，微软发布了2023年年度工作趋势报告，基于微软来自31个国家和地区的31000员工的调查数据，呈现出了员工对人工智能的看法、以及人工智……

坦言AI将对世界造成重大伤害！OpenAI CEO呼吁加强AI监管

芦虎导航5月17日消息，近日，ChatGPT开发商OpenAI的CEO Sam Altman接受了美国针对人工智能举行的首场大型听证会的邀请……

任天堂提前终止3DS官方维修服务：维修配件已用完

站长之家 3月9日消息:日前任天堂官方宣布，由于3DS 掌机的相关维修配件已经全部消耗完，今后官方将不再在日本地区提供3DS 和3……

李彦宏：AI不会替代人类工作机会而会创造更多就业

芦虎导航5月18日消息，在第七届世界智能大会上，百度CEO李彦宏发表了题为《大模型改变人工智能》的演讲。他指出，人工智能不会替代人的工作机会……

Meta正研发首款定制AI芯片：功耗低于NVIDIA

芦虎导航5月19日消息，当地时间周四，Meta宣布，它正在研发首款专门用于运行人工智能模型的定制芯片。Meta并不像谷歌、微软等科技巨头从事……

九哥模板

九哥模板提供苹果cmu模板,海洋cms模板,影视网站模板,苹果cms插件免费下载。

千层云

千层云（Qiancengyun.com）领先的物联网及人工智能科技公司。提供云产品、通信产品、物联网

圣阳电池厂家

广东北能新能源有限公司以环保节约为设计理念，以电力电子技术为核心,始终致力于数据中心关键基础设施产

UPS电源租赁

广东北能新能源有限公司是一家致力于为全球提供可靠的机房基础设施解决方案的提供商，专业提供UPS电源租

圣阳蓄电池官网

山东圣阳电源股份有限公司是国家级高新技术企业，拥有国家认定企业技术中心，主导、参与制定国家、行业标准

双登电池厂家

双登蓄电池，大数据时代专业的绿色储能集成服务供应商，双登电池厂家提供双登铅酸蓄电池（双登AGM电池、

理士蓄电池官网

理士国际技术有限公司（理士电池厂家）始于1999年，是专门从事全系列蓄电池研制、开发、制造和销售的国

37导航网

37导航网，是一个资源类技术教程活动导航分类平台，收录优质站点已数千，如AI工具集,在线工具，学习提

吉卜力风格图片生成

使用 AMZ123 的吉卜力风格图片生成工具，只需上传、点击生成，即可通过AI技术让你的人物、宠物或

Marstone

麦思通Marstone国内知名的以智能升降护栏产品的研发、生产和销售为核心的周界防护解决方案提供商和