诗集古诗网首页

您现在的位置是: 首页 > 小说

英伟达再次突破想象力!一句话实时P图「创世纪」在线Demo可玩

2021-11-24 15:36:08诗集古诗网首页
  上面这些效果,都是英伟达这个叫做“GauGAN2”的模型做出来的,而它的“完整版”功能,还远不止这些

  上面这些效果,都是英伟达这个叫做“GauGAN2”的模型做出来的,而它的“完整版”功能,还远不止这些。

  树林中的阳光”,输入in winter后,眼前本来郁郁葱葱的树林立刻“全秃了”,换成了雪景下的一幕:

  还能输出不同style的风景图,例如输入“大山(mountain)”一词,立刻要山有山,还能给你换不同风格:

  当然,这些不同的风景照也都能继续生成新细节,在mountain后加上“beside a river”就能生成山水:

  只需要把想替换掉的部分圈出来,输入你想要的东西,就能立刻造出各种新颖的风景图:

  嗯……英伟达给出的这个demo,思路也是非常清奇了,“浮在空中的城堡”:

  这是上一代GauGAN2(2019年英伟达推出的GauGAN)的看家本领。

  例如,要是想实现下面这样的“一片天空两个太阳”,就完全可以在通过文本生成的图像上,自己手动再加一个。

  然后让GauGAN2根据已有的画面,再重新生成图画,就会得到如下“人头海岛”的神奇景观:

  不过这可能也对个人画技有所要求,在我们的灵魂画风下,效果看上去就有些……不太聪明的亚子。

  当时的它,还只拥有其中一个能力,就是将涂鸦直接变成风景画,就像「神笔马良」一样,还推出了对应的软件Canvas:

  当然,这时GauGAN已经能随意改变画面风格了,从白天黑夜到春夏秋冬的气质都能稳稳“拿捏”:

  据英伟达介绍,GauGAN采用了一种基于空间适应标准化(SPADE)算法。

  SPADE算法不仅使用随机的输入图像,还采用了一种被称作“分割图”的图像。在分割图中,每一个像素都会被归类,来生成更接近于真实的图像,这种模式被称作“图对图翻译”。

  高质量的图片、在英伟达Selene超算上进行训练,这台超算在Green500排行榜上排到世界第二。生成这些风景画的效果和“手法”,是不是感觉有点熟悉?

  没错,大多数人看到GauGAN2的第一眼,可能都会觉得它和OpenAI的DALL·E+CLIP有点像。

  今年年初,OpenAI用DALL·E和CLIP两个模型,做了个“图像版”GPT-3,同样能用一句话生成图片。

  GauGAN2专注于生成风景照,DALL·E+CLIP则更多地生成具体的物体,例如一把椅子或者一个闹钟等。

  这与它们的原理差异也有关系,GauGAN2更加注重“单词与视觉效果”之间的关系,例如“冬天”这种模糊的状态词给照片带来的效果;DALL·E+CLIP则更注重“文字-图像”这种有明确对应关系的物体效果。

  据英伟达介绍,GauGAN2不同于“文本-图像”和“分割图像-图像”一类的模型,它所能产生的照片种类更多,质量也会更高。

  比如给出“沙滩(beach)”一词后,有些生成的画面中出现了语言无法描述的事物。

  对此,英伟达表示,他们在训练中“完全没有用到任何人像照片”。(所以可能是偶然?)

  但这样一来,网友想要的“瑞克摇(Rick roll)”和“鬼畜视频生成”,GauGAN2大概也是没办法实现了。

  最后,GauGAN2在浏览器上就能试玩,欢迎大家留言讨论自己的体验感受~

  印军欲将S-400部署到中印边境,有分析称:对S-400,解放军比印军更熟!

  马斯克质疑币安平台问题让用户买单,币安创始人赵长鹏回应附特斯拉召回新闻,事涉暂停狗狗币提币币安近期频现提币频卡顿空投久未发放

  对手离谱丢空门!巴萨真悬了:末轮赢拜仁才确保出线队都有可能出线!刚上场就轰任意球绝平 末轮迎生死战

  Riot Games 公开英雄联盟格斗游戏《Project L》实机画面

  支持10×20米大空间,Holomia发布Quest真人CS游戏《MissionX》