当前位置: 杭州网 - > - 杭网原创 - > - 原创新闻
网易伏羲人工智能实验室李仁杰:AI可以让游戏更美好
发布时间:2019-11-24 17:04:10 Sun  来源:杭州网

杭州网讯 11月24日,由杭州市人民政府和网易集团联合主办,杭州市经济和信息化局、杭州滨江区人民政府、杭州萧山区人民政府、北京网易传媒有限公司及网易(杭州)网络有限公司承办的“2019网易未来大会”之“未来数字生活论坛”召开,网易伏羲人工智能实验室负责人李仁杰分享了《AI让游戏更美好》的主旨演讲。

李仁杰表示,游戏并不是洪水猛兽,而是让我们与同伴交流最轻松的方式,甚至是一种获得技能最有效的手段。此外游戏还推动了CPU/GPU等硬件的发展,催生了非常多新模式的发展,比如直播;游戏还是很多新技术的载体,比如人工智能。“游戏已经和我们的生活密切相关,它不仅是我们个人的娱乐方式,还间接推动了社会的发展。”

对于未来的游戏如何更好玩,李仁杰称,答案可能有非常多种,但人工智能一定是其中一种。比如人工智能可以让游戏的形象变得更逼真、会说话、能动起来,可以提高玩家的体验,甚至可以提高游戏从业者的开发效率。

伏羲人工智能实验室就是由一群热爱游戏又喜欢人工智能技术的小伙伴们建立起来的,其初心就是希望可以用人的技术来帮助游戏开发者提高效率,为玩家带来革命性和创新性的体验。

“文化创意产业是21世纪国家软实力竞争的制高点,是每个国家向外输出价值和文化观非常重要的一环,但这目前还是国家的短板,我们希望可以利用人工智能实现弯道超车,助力文化输出。”李仁杰表示。

附:以下为网易伏羲人工智能实验室负责人李仁杰演讲内容:

大家好!我是网易伏羲人工智能实验室的李仁杰,和开心来到未来大会,和大家一起畅想未来。看到这个标题,大家不用猜也想到我是一个游戏爱好者,确实是。非常幸运,我的爱好也成为了我的工作,在过去十几年我一直都从事于游戏行业,我以前参与过的开发的游戏,可能大家有听过甚至很多人也或多或少玩过,有魔兽世界、英雄联盟等等。所以,我们今天聊一下游戏的未来。

我们先看一下什么是游戏。大家很多很少都玩过一些游戏,但可能大家或多或少对游戏也会有很多的误解。如果我问大家一提到游戏,你们想到什么?可能大家想到的第一个词是“沉迷”,第二个词是“氪金”,但实际上这才是新华字典对游戏的定义——“娱乐活动以及某种非正式比赛的智力或体育活动”。

其实游戏不是洪水猛兽,甚至当我们还是婴儿的时候,我们就是通过一个个和我们父母之间的小游戏来感知这个世界的,游戏可能是人类最古老的一种获得愉悦的方法,它也可能是我们最轻松的一种和同伴交流的方式,甚至还是一种最有效的获得技能的手段。其实作为一个游戏从业者,我们做游戏的初心就是想通过游戏让大家的生活变得更美好,我们首先希望游戏可以给大家带来开心,其实每次看到大家在玩游戏,脸上流露笑容的时候,其实就是我们最大的满足。

另外,我们希望游戏可以给大家带来不一样的体验,这种体验是交互式的,这也是游戏作为第9艺术和其他8大艺术不同的地方。8大艺术有绘画、文学、影视、戏剧等等,游戏不只是默认的阅读或者欣赏,它是一种你可以和环境互动、可以和角色互动,也可以和其他的玩家互动,而且这种互动的反馈是及时的,这是任何一种其他游戏的方式都不可替代的。

我们还希望大家玩游戏的时候,同时得到收获,也许是你完成一个挑战得到了一些成就感,或者你在游戏里面收获了一个新朋友。而且一直有科学研究证明,玩游戏可以提高大脑的认知功能。

无论是古老的游戏,像俄罗斯方块,或者是代表了现在当今中国艺术水平以及制作水平最高的《逆水寒》,其实它们的本质都是一样的,都是我们希望游戏能为大家带来愉悦,带来沉浸式的交互体验,以及让大家有收获。

其实游戏不仅仅是我们个人的一种娱乐方式,它还间接推动了社会的发展。拿硬件举例,可能大家的电脑或者手机上最复杂的应用程序就是游戏了,每一次GPU或者CPU的升级换代,一定都和游戏相关。如果没有游戏的存在,可能大家现在用的手机和硬件还保持在过去三年或者五年的水平。

另外,游戏还催生了非常多新模式的发展。刚才新物种爆红逻辑论坛,大家也提到了直播,实际上五六年前爆红的直播模式后面又带动了网红经济,也催生了很多直播带货,其实最早的直播是游戏诞生的。包括Twitch是全球最大也是最早的直播网站,它到现在也是全部和游戏相关,国内直播的鼻祖斗鱼、虎牙等等都是从直播游戏开始的。

另外,游戏还是很多新技术的载体。比如说DeepMind在《Nature》上发表的论文点爆了这一轮人工智能的浪潮,但其实那篇论文讲的就是用深度神经元网络教会电脑如何打AlphaStar小游戏。后面每一次DeepMind的算法升级甚至一些革命性的新体验,也全部和游戏相关,比如说最近AlphaStar在《星际争霸》里已经成长成为人类最高水平的玩家。同时,现在如火如荼的自动驾驶公司也开始用游戏作为一个载体,因为在现实场景中获得数据有非常大的风险,而且也会非常昂贵。所以,游戏天然提供了一个封闭式的训练环节,可以让大家非常快捷地得到数据,进而进行更加高效的训练。

所以,游戏已经和我们的生活密切相关,它是我们个人的娱乐方式,还间接提高了我们整个社会。

未来的游戏会是什么样子?我们又可以做些什么,让游戏变得更好,从而游戏又可以让我们的世界变得更好。可能答案有非常多种,但是人工智能一定是其中的一种。

比如说人工智能可以让游戏里的形象变得更加逼真,可能一个艺术家要经过五年甚至十年的时间训练,才能成为一个非常好的艺术家,画非常逼真的画作。而当他真正是一个大艺术家的时候,也需要做非常高质量的创作,我们为什么不用人工智能帮助它?这是八个栩栩如生的人脸,但都不是真正的人,这都是人工智能从千万张人脸照片中学习,然后自己生成的人脸,这也代表了Nvidia目前最先进的2D人脸生成技术,我们也非常有创意地把这个技术应用到游戏当中,并且从2D升级成3D,这也是世界上第一次在游戏上实现智能捏脸的功能,在逆水寒里面。也就是说玩家可以上传自己的照片,我们不仅可以从你的2D照片生成3D形象,跟你长的像,发行类似,而且符合游戏的设定。大家可以想像未来的游戏,每个人可以用自己的形象玩游戏,真正做到千人千面,这会是一件非常有趣的事情。

大家有了形象之后,我们希望游戏里的角色还可以说话。我们看一下目前世界上人工智能自然语言处理的技术可以达到什么样的水平。这是谷歌在开发者大会上发布的一个demo,是人工智能预约剪头发,右边是发廊的托尼老师,左边人工智能。(视频)所以这段视频,当时给大家留下了非常深刻的印象,尤其是最后那句“MM-hmm”惟妙惟肖,但依然没有办法满足游戏对自然语言的需求。因为大家用到过手机里面的智能语音助手或者智能音箱,但是大家发现它是一个冰冷的工具,并不会让人感觉这是真正的人,可能没有人跟智能音箱聊天聊一个下午。但在游戏里面,每一个角色都有人物设定或者性格设计,所以游戏对自然语言的处理有更高的要求,其中第一个要求是带有个性化、带有人设。

我们在带有人设的自然语言处理上做了尝试,并且把它落地在《倩女幽魂》手游里面的智能小孩系统,每一个小孩都是不同的,而且根据你如何培养这个效果,他也可以成长为不同性格,有可能是霸道总裁类型的,可能是风趣贱萌的,也可能是幽默温暖的。每一个小孩,根据你怎么培养他,他的性格生成的不同,也会说不同的话,如果大家感兴趣的话,可以去《倩女幽魂》手游里面体验一下。

有了形象,会说话之后,我们希望他说起话来也会更像人。大家可能看到过很多动画片或者好莱坞的大片,里面的人物形象栩栩如生,但用的是动捕的技术,就是一个演员穿一个紧身服站在这里,脸上、身上都贴了很多的marker,我们就抓捕他表情的动作和身上的动作,来迁移到不会动的形象上,从而可以让形象动起来。这个过程,确实可以做到效果非常好,但是它耗钱耗时耗力,所以我们在想我们是否可以利用人工智能的技术帮助这个过程,只要给一段文字或者一段语音,虚拟形象就可以自动表演。大家可以看一下这是我们做的尝试,左边是人工智能合成结果,右边是动捕的真正效果,大家可以看出里面的区别。可能会有一些细微的差别,但是如果我把上面两行字遮住,不告诉你哪个是人工智能合成,哪个是动捕演员自己演的,大家可能看不出来,因为我们已经通过了图灵测试。我们觉得这种方法,其实可以大幅度提高动捕的效率。

所以刚才我们说我们有形象了,形象AI可以让形象更逼真,可以让角色说起话来,自然而然我们希望它可以动起来。我们看一下现在人工智能的技术在动作迁移领域上达到了什么样的水平,这是伯克利专门做动作迁移水平放的demo,就是你在视频前面做一段动作,我捕捉你的动作,然后我就可以利用你的身体合成任何想合成的动作。这里的人先做了一些动作,然后把它捕捉下来,左上角由另外一个视频做一些动作,现在它展示的动作实际全部是由合成的,不是人真正做到的动作。所以,这是一些动作迁移或者动作模仿达到的效果。

我们还在想,我们是否可以更加有创意,让人工智能自己去生成动作,他自己去生成、自己去跳舞,所以我们也做了尝试,这是世界上第一次实现了人工智能通过音乐去自己跳舞。这里的人工智能跳的舞蹈完全没有任何人为的编排,全部是人工智能在听了音乐之后即兴自己跳出席的。因为网易未来大会是一个高端大气的大会,所以我们用了一段很正能量的格局《红旗颂》,但实际上他可以跳任何的曲风、任何风格,比如说你给他流行格局,他会跳街舞的风格,如果给他古典的歌曲,他可能会跳一个古典的舞蹈。

所以,我们有了形象,会说话,又能动起来,还差什么?大脑智慧,我们希望未来游戏里面的角色也都可以像人一样聪明,这就需要用到强化学习的技术。AlphaGo就是用强化学习的技术,实现了在围棋里打败人类最强的围棋手。所以我们在游戏里面也应用强化学习的AI代替传统的AI,这是在游戏情侠传,离大家近的是人工智能AI,离大家远的是一个人类玩家。我们还把它应用到更复杂的场景,这是是潮人玩球,如果不告诉大家哪一对是人工智能,哪一对是人类玩家的话,大家可能不太能看出来,脚底下有圈的是人工智能的玩家,没有圈的是人类的玩家。所以在第一天的时候,这些人工智能可能还非常傻,不会随机用技能,第二天的时候,它们就可以学会连招,第三天他们甚至学会如何欺骗人类玩家,第四天就可以达到平均人类玩家的水平。

所以我们刚才说的都是一些如何用游戏去提高玩家的体验,其实我们还想用游戏去提升我们游戏从业者的开发效率。比如说动画的制作,像这样一段一个动起来、转一圈、坐下弹琴的15秒的视频,大概需要一个资深艺术家两个小时的时间,但时间上这段动画是人工智能自己做的,只需要3分钟,也就是说我们节省了97%的时间。换一句话,它把我们的效率提升了30倍。我们可以利用这样的时间,让大家不再做重复的劳动,从而可以打幅度提高大家的生产率和生产效率。

另外,我们还可以用人工智能保护未成年人,相信这也是很多父母关心的事情。比如我们可以利用人脸识别的方法,去防止我们的未成年人过多打游戏或者防止他们偷偷打游戏,甚至我们还可以利息算法精准判断眼睛和视频的距离,可以保护眼睛卫生和视力。刚才说了形象、动作、语音、互动、效率、防护等等,其实还有更多方面可以探索,只要我们敢于创新和试验。

今天是未来大会,但实际上未来离我们并不遥远,因为我们刚才所说的每一个,因为我们已经开始在探索人工智能应用到游戏的未来。刚才给大家展示的每一个例子,都来自于我们的伏羲人工智能实验室。

伏羲人工智能实验室就是由这样一群热爱游戏又喜欢人工智能技术的小伙伴们建立起来的,我们的初心就是希望可以用人的技术来帮助我们的游戏开发者,提高他们的效率,来帮助我们的玩家,来给他们带来革命性和创新性的体验。其实我们还希望以后在游戏里沉淀和激烈了这些技术之后,我们还把它推广到整个文化创意产业当中,因为文化创意产业是21世纪国家每一个软实力竞争的制高点,是每一个国家向外输出价值和文化观非常重要的一环,可能目前还是我们国家的短板,我们希望利用人工智能实现这样的弯道超车,助力我们的文化输出。我也希望我们下一代看的、玩的、崇拜的不再是钢铁侠、蜘蛛侠,而是我们的山海经、封神榜或者西游记。

今天是未来大会,而且我是最后一个演讲的,所以我大胆畅想一下未来一百年、两百年游戏是什么样子的,游戏成为那个样子,又如何改变我们的世界。不知道大家有没有看过《西部世界》的电视,《西部世界》是人为创造的虚拟的真实世界,为什么说它是虚拟的真实世界?是因为里面所有的事情全部都是由人工智能自己实现的,但是它又极其真实,你完全无法分辨。也就是说在那里,你可以体验到任何你想体验的事情,这一定是游戏的未来。而且当我们真正做到的时候,让每个人都可以体验你想体验的事情,这可能才是真正的生而平等。为了达到这样的游戏目标或者这样的愿景,一定还会催生非常多的新技术的爆炸式的产品,比如有3D房屋打印或者是量子计算机或者便携式可控核聚变电池,而且甚至可以在我们的身体趋势以后,让我们的身体和形象、意识以人工智能的方式存在在虚拟世界。当我们真正实现虚拟现实化、现实虚拟化之后,我们可能还会不得不回答一些返回本原的问题,我们如何与虚拟人相处、虚拟人和机器人也有生命吗?我们人类是不是只是由生物和化学的机器人而已?当我们有一天真正要面临、回答这些问题的时候,可能带来的是自我意识和人类社会的二次进步。

所以,这是一些关于未来游戏和世界的畅想,我相信AI可以让游戏更美好,我更相信游戏可以让世界更美好。谢谢!

作者:首席记者 林海燕 记者 黄任为  编辑:李建刚