首页 > 快讯

2022新智者大会|何展:人工智能助力普通人成为数字内容创建者

2022-07-27 16:09:02      西盟科技资讯   


  7月27日,由中国互联网协会指导,微博、新浪新闻主办的人工智能领域行业峰会“融合生态 价值共创”2022新智者大会召开。NVIDIA英伟达中国区Omniverse负责人何展在大会的“元宇宙,智能时代的下一站”议题中,向来自业界、学界的嘉宾们介绍了NVIDIA Omniverse在创建数字世界方面的一些探索和成果。

2022新智者大会-英伟达中国区Omniverse负责人何展做主题演讲

  以下为何展演讲实录,内容经编辑略有删减:

  何展:大家好,欢迎参加2022心智者大会,接下来的时间由我来和大家分享,NVIDIA Omniverse和您一起创建数字世界的演讲,我来自NVIDIA英伟达,我叫何展。

  首先和大家去分享一下,我们今天的第一页,来跟大家去展示一下英伟达公司是一家什么样的公司,这里给大家展示的是我们硅谷总部的大楼,非常漂亮,非常充满科技感的两栋建筑。

  这两栋建筑在设计的时间里面,我们做的渲染的效果图,都是来自今天我们重点和大家分享的NVIDIA Omniverse这样的一个技术平台,我们也非常欢迎大家有机会到硅谷一起去参观我们这栋非常有科技感的大楼。

  那今天也给大家去分享一下,我们NVIDIA英伟达公司实际上是解决世界上很多难以解决的科研问题,甚至是一系列的计算,一系列应用难题的一家公司,非常的技术。我们今天,首先给大家带来两个案例和大家做一个开头的分享。

  第一个案例,是我和我们的科研人员一起去分析我们人类最大的天敌,其实就是癌症,大家可以看到这张图非常清晰的这些数字化,模拟的很多的一些高危险系数的图像,大家可以看到,这是我们科研人员通过我们的实验室的这种高精度的显微镜去观测到的一个非常罕见的现象。

  这个现象是什么,大家可以看到,我们的癌细胞实际上是分裂是一个,由一个分裂成两个,那我们再通过这样的技术,可以观测到一个罕见现象是一个变成了三个,那这类的,我们需要数字化的这些技术来去观测到,去模拟和仿真的到,那这样的话,就会可以帮助我们科研人员更好地辅助我们的一些算法,来去帮助到大家去处理,或者是去提前找到方法,去解决这样的一些罕见的这种疑难杂症,这是第一个,这也是给大家分享,我们通过数字化给我们人类带来和身体健康有关的这样的一个项目。

  那么再看第二个项目,大家可能没有特别关注的天体力学,包括我们大家看到很多科幻的小说,可能会很多人关注和喜欢这类方向的技术。

  那这里给大家分享,这是我们在2016年的一个项目,这是人类我们的科学家有史以来,第一次发现了引力波,大家都知道黑洞形成的概念,也有很多科技迷,爱好者,科幻迷爱好者喜欢这类的东西,我们是第一次在实验中,我们发现了引力波的存在,这里也应用到了我们很多的技术,所以这里边有三位物理学家在2017年,因此获得了诺贝尔物理学奖,这里边也是有我们的NVIDIA GPU,包括在这里边做到的一系列的贡献。那分享完了这些案例,大家可能看到我们现在不仅仅是一家硬件的公司,不仅仅是一家GPU公司,我们解决得非常非常多的(问题),通过好的技术,来去解决很多新的业务应用,新的科学难题的,这样一家全软件堆栈的AI计算平台公司。

  我介绍完我们公司的定位,还有做的一些事情之后,跟大家进入今天的主要的内容。

  首先和大家分享一下,我们这个时代是一个全新的数字化时代,我们即将进入一个带有现在非常多因素和科技含量内容的这样的一个时代,大家看到这里边有我们可以关注到3D,沉浸式的体验,我们还有新社交,我们还有很多很多的交互性的技术,包括我们自主意识的机器人,还有我们下一代的AI,那这些关键词都代表了下一代我们看到的即将到来的,我们需要关注的技术方向。

  我们继续看,介绍一系列今天给大家带来的很好玩,很新鲜,很有科技感的应用之前,跟大家再分享一下我们今天有什么样的一个技术平台来实现,我们需要有一个开放,我们需要有一个标准,需要让每一个人都可以去使用的这样的一个平台,那就是NVIDIA Omniverse,大家看到我们的定位就是创建,模拟以及体验。

  那这里边有个定语,我们叫物理准确的数字世界的技术平台,这是我们的一个定位。

  大家看这张图,其实有非常多的内容,我们以数字工厂这样一个数字化孪生世界作为一个示范,大家可以看到,我们如何去把它创建出来。同时利用一些(技术),比如说AI,比如说我们的图形学渲染,比如我们各类的实时光线追踪等等一些记录技术的集合,才能够真正实现物理准确。

  那这里面可以看到,我们以前大家看到,过去一些年都是互联网,是2D的互联网,那么现在即将到来的,给我们带来更大意义的是3D的互联网,那所以这些技术是非常能够帮助到我们的工厂,帮助到我们的设计师,能够符合刚刚我上一页介绍的,下一代我们的AI,下一代数字时代的这些技术,所以这是我们的定位。

  我们的下面给大家带来了一些很好玩的应用,首先关注的是我们的新的创作方式,大家可能经常会听到UGC,PGC,现在的AIGC,这些都是我们的创作者们给大家带来的一些系列新的概念,我们看看今天给大家带来的一个新的创作形式。

  这是我们2019年我们的同事展示的这么一个创作的过程,大家看到其实我们做的实际上是2019年,当时是纪念阿波罗登月的一个纪录片,这里展示的技术,大家可以看到,我们的同事用自己这样的一个动作,那它是怎么样去把它动作传导到这样的一个数字环境中的,传统的其实就是用很精密的Mocap的设备来去把它给记录下来,现在大家可以看到就用ipad,用算法,这个算法叫AI post的算法,它可以把我们同事肢体的动作可以识别出来,映射和传递到我们想要的数字的虚拟环境中。

  大家可以看到,这个里面都是同步的,同时,还可以实现实时的,下面的这一个镜头可以看到我们很多的这些内容,所以这些技术都是我们看到的,大家可以看一下,做的这些动作,这些肢体的抓取是非常精确,这个实现了很多很多我们过去非常非常长的,生产设计的周期,用这种算法的方式来去实现,所以这个是我给大家介绍新的创作方式。

  那么再看一下,刚刚提到了PGC和AIGC,我们也带来了最新的内容,我先把视频放完,大家先去欣赏一下,大概两分钟。

  大家看到了这一段视频,我给大家展示一下这里边非常复杂的几个技术环节,大家看到鹅,这个鹅做的翅膀的一个动画,这个动画是非常难以做的,我们这里边就有一个非常自动的动画系统,还有一个就是大家看到机甲战士,机甲战士他在航母舰上,整个奔跑的动作,肢体语言,就是我刚刚介绍的AI post的一些算法,不需要特别复杂的设备,你可以去识别,去抓取,通过算法来去生成他这些所有的跑动的动作。

  第三个,大家可以看到片头的时候,有一段航母非常颤抖的镜头,这个镜头都是我们的平台内置的算法做到的,而不是你模拟,很难模拟出来的,那我刚刚也提到了,有一个技术词汇就是物理准确,这也是一个非常有意思的技术点。

  还有一个镜头就是大家看到,我们的战斗机,那个战斗机应该是F14战斗机在翻滚的时候,我们的艺术家和设计师里面放了一些小的彩蛋,大家看到,有很多什么葱,什么洋葱,他在那翻滚,实际上我们想去给大家展示一个技术实践可能,就是以前这些都是一套动画来去模拟它,那我们现在技术平台里有一个重力感应键,你可以把它打开,就可以去实现在计算在战斗机翻滚的过程中的那种失重的状态,所以这些一系列的这些技术可以都给大家去展示出来。我可以告诉大家,这个其实是很快的时间就可以做出来的,这些技术难度,如果用传统的流程来去做,会非常的长和复杂。我们现在基本上可以缩短到1/10的时间,那是给大家提供这样的一个分享。

  那第三块应用,大家可以看到,现在非常火的就是数字人,包括数字形象。我们现在这部分的内容,其实也给大家去展示了,我们如何用技术更快,更好地去制作,同时我们如何引入AI的能力,让大家从这种非常非常重复的工作中解脱出来,大家可以看到,这个大家可能都知道,我们在GTC上,我们大会上,我们创始人做Digital Jensen到Toy Jensen的过程,大家看到所有的过程,我们已经展示了我们如何更快,更好地来去把超写实数字人的工作,整个的流程缩短到最极致,大家看到其实我们在Digital Jensen上放了14秒,但实际上我们整个在后面做了整个五分钟的视频。

  其实五分钟基本上是一个好莱坞大片制作特效的这么一个标准的时长,大家知道五分钟的特效基本上可能会用上百人的团队可能需要至少六个月,甚至八个月的时间完成,那我们做的这一段引入的这些技术,大家猜一猜,其实我可以告诉大家,我们用了七天就做完了,怎么做到的,就是这张图,大家看一下黄颜色的三个算法,叫Audio 2 face,Audio 2 gesture,包括Face Video 2 video,大家看其实前面两个,Audio 2 face,Audio 2 gesture,就像我今天演讲一样,其实未来有可能用这种算法,用语音的输入,来去驱动我面部的动作,语音的输入驱动我的肢体语言,这样的算法,包括后面的FaceVideo 2 video就相当于大家看到我们扫描的模型其实没有那么真实。

  那我们通过一个算法可以把我们创始人演讲的“照片”去映射到3D的模型上,这样用算法实现的这种超写实的数字形象,数字人会制作得非常快,所以过程是想告诉大家,我们可以通过新的技术把传统的流程缩短到极致。

  这里我们也给大家展示数字人制作的这种非常精致的这种状态。这里边有毛发系统,包括很多的这些皮肤材质,所有的光照的一些模拟,大家都可以看到,通过软件来去做到。

  其实我们已经进入了技术的成型期,都可以帮助大家实现到这个级别。我们再看,如果有了数字人的非常精致和超写实的形象这种状态,如何去帮助大家走到下一步,让人动起来,这里给大家带来刚刚我提到的一些例子,这个视频里面很有趣,其实就是一段生日歌来去驱动犀牛的表情。

  大家听到这歌就知道这是一个女孩儿唱的,我给大家分享视频幕后的故事,她是一个六岁的女孩儿,通过很短的时间,把自己录的生日歌通过我们的算法来去驱动他最喜欢的这些动画犀牛的角色,制成的视频,这段视频在她父亲的生日当天送给他。

  所以这个例子,给大家分享的就是我们期待,会让更多的普通人去做,能够有能力去设计属于你自己的数字化作品,这是AI的算法来完成的,也是我们的理念,让我们的技术门槛降低。

  我们再看,在最后结束之前,我再给大家分享两个我个人认为比较颠覆性的技术。

  首先看第一个技术,大家看工具叫GauGAN 2,我们看视频就能知道他能够做到什么,这里面看到用输入一些文字,那这个算法就可以去理解这段文字,并且去生成对应文字语义的,真实的照片,就是我们已经实现的,这叫GauGAN。

  大家看到画笔,算法都可以结合起来,我们很多开发者管这个算法叫“神笔马良”,这个工具是免费使用的,大家可以上我们的官方网站来去体验它。

  第二个颠覆性的小技术,我们叫3DMoMa的算法,大家看这段视频,可以知道,刚刚我们说有了算法生成图片,那我们有了图片,我们是不是可以生成三维,大家可以看到这里边我们生成的3D模型,120多张图片,用算法生成的,不是CAD软件做的,那我们生成的3D模型还可以编辑它的材质,还有它的光照的信息,还有物理属性信息,这个就是一个非常颠覆性的,2D转3D的这样的一个算法生成的应用,希望给大家带来非常多的新的启发,让大家的制作更加快速、更加的便捷、更加的真实、更好、更落地。

  我最后跟大家总结一下,今天和大家分享的内容,那我们的NVDIA Omniverse有三件事情可以跟大家分享。

  第一,我们期待着通过一系列的技术,降低门槛,让每一个普通人成为数字内容的创建者。

  第二,我们非常关注工程化的技术,所以刚刚我们在几个应用案例里跟大家都分享了物理准确,基于物理,物理准确。

  第三,我们非常全面的去拥抱AI。

  最后这段话也分享给大家,人工智能从根本上改变了软件可以制作什么,以及你如何去制作软件。

  好的,今天我分享的内容就是这些,希望有更多的时间和朋友们一起交流,我们的新技术如何去在数字化世界创建的过程中颠覆未来,颠覆以前传统的技术。那今天,我的演讲内容就到此结束了,谢谢大家。

  榜单收录、高管收录、融资收录、活动收录可发送邮件至645528#qq.com(把#换成@)。

相关阅读

    无相关信息