|
坏的开始
Siren也许是更为大众所了解的项目,这是一个虚拟数字人项目。名字取自北欧神话,女妖塞壬。相传她拥有天籁般的歌喉,常用歌声诱惑过路的航海者而使航船触礁沉没^1。
黎叔起这名字的时候,光注意了名字的调性,英文不错的我们,也都纷纷叫好。古有贞子破屏而出,今有塞壬让宅男破幕而入,这个愿景激励着我们努力。
不曾想,今后的宣传中,无数人跳出来说,起什么代号不好,偏偏要起一个“死人“的代号。所有的能力,都会遮蔽双眼。英文不错,反是负担,我们都忽略了Siren还能被解读成死人。
好在当时,我们并不知道这一切。倘若不然,想必在研发的过程中,大家会多了些许负担。而对于这样一个艰巨复杂的项目,没有信心的我们,若非无知无畏,若非轻装上阵,早已落荒而逃。
真正的开始
这个项目来源于一次合作。Epic和腾讯希望找机会做技术合作,于是我们和Epic CTO开会交流。
会中各种方向讨论,都不算靠谱,或者是太鸡毛蒜皮,或者是太虚无飘渺。最后他抛了一个想法,想要合作做虚拟音乐会,也就是一段超高质量的MV,大家觉得还不错,于是匆匆结束下午的会议,进入了大家喜闻乐见的晚餐环节。
晚上商务宴请,一顿潮汕火锅涮完,CTO碎碎念着,说大家不太喜欢这个想法,闲谈中聊到这个项目,没有那种眼中有光、心中有火的状态。
然而这并不重要,一肚子牛肉要消化,明天总要到来。所谓方向,即使一开始并不起眼,也许熬着熬着,做着做着,也就柳暗花明了。
但事实是残酷的。大多数想法,都不会做着做着才变得惊艳。一个好的想法,自然有打动人的力量,即使一开始那么不起眼,当你听到它,就会觉得,就是它了。虚拟演唱会的想法,还缺一点意思。
第二天,Epic的CTO同学又带来新的想法,这次的方向,就是虚拟人。所谓虚拟人,就是高质量的CG人物,能够乱真,可以交互。
这是一个有趣的想法。
并不是每个有趣的想法,都有价值,我们又该如何判断它的价值呢?
决策
对于未知领域,究竟什么想法靠谱,什么想法不靠谱,很依赖于人的直觉,但也有一些客观的方式可以判断。依我看来,有四个维度可以帮助做决策。
你先要看可行性,再好的想法,做不出来也是白搭。我们可以承受适当的风险,风险越大,越看不清的方向,就越需要控制投入的规模。虚拟人这个想法,有不错的可行性,电影行业特技已可乱真,而游戏行业静态画面也能媲美照片,在这个飞速发展的时代,的确孕育了实时渲染的数字人技术的可能性。PC消费级硬件的性能突飞猛进,已经奠定了基石。
可行性不光看大环境,自己团队是不是适合做这个事情,也是一个重要的考虑因素。我们团队有不错的游戏开发经验,也能胜任高级渲染技术的开发,而更重要的是,Epic的CTO Kim Libreri,来自电影行业,从事电影特效多年,赢得过两次奥斯卡奖项,有足够的行业洞见和人脉资源,是一个最佳的带头人。
看完可行性,再要看它有没有技术壁垒。如果投入做一个很简单的技术,其他团队很容易就能复刻,那么投入的价值就不那么大。既然是探索新领域,我们希望“用时间换空间”,投入更长的时间,获得持续的积累,而我们也希望这个积累,能产生一些壁垒,让别人很难轻易复制。虚拟人很符合技术壁垒的定义。这个项目在多个领域需要做出突破,在建模精度、RIG质量、渲染效果、实时表情捕捉等各个方面都有巨大的挑战。这里有相当多的领域,横跨了游戏和电影行业。而所有跨越边界的技术,都不好做。游戏谈起渲染质量,电影乐了;电影聊起实时交互,游戏笑了。陌生行业的鸿沟,那些越过边界的不确定性,那些遇到难题的不知所措,就是技术的壁垒。
The brick walls are there for a reason.The brick walls are not there to keep us out.The brick walls are there to give us a chance to show how badly we want something.Because the brick walls are there to stop the people who don’t want it badly enough.They’re there to stop the other people.
Randy Pausch
网上广为流传的“最后一课”的教授,也讲过,墙并非无缘无故而来,墙把我们挡在外面,只是要给我们一次机会,一次证明自己的机会。它在那里,只是想把那些意志不够坚定的人阻挡在外面。这堵墙,就是技术的壁垒,它不仅仅是努力的目标,也是努力的信心。因为我们知道,当我们翻过这堵墙,它就是我们的壁垒,阻挡那些不够坚定的竞争者。
然后要看它有没有技术价值,这个技术,会不会产生有价值的积累,应用到其它产品中。实验室的前沿技术,大多不能应用在实际的产品中。而能用在产品中的技术,往往有不够高端。我们要寻找的,是那些略高于目前技术水准的技术,可以在2-3年后,应用到产品开发中。
虚拟人技术,跨越了多个领域。其中渲染质量的提升,相当多的理念都可以受益于电影行业的技术。在渲染领域,电影行业的今天,就是游戏行业的明天。提前了解一些更高端的技术,对未来的游戏研发技术,也有实质性的提升。而研发过程中,也能产生大量的副产品,这些副产品,同样可以用于游戏研发,提升研发的过程技术。比如AAA游戏以及一些叙事游戏,类似《底特律—变人》、《Hellblade》等,早已开始用类似的制作管线生产过场。而更基础的照相建模、动作捕捉,也在游戏开发中越来越广泛使用。在国内行业中,大量外包公司也已经提供类似的服务,如果自己拥有这样的设备,可以大大加速迭代的速度,也能深入研究,开发更多有趣的功能。
最后看它能不能吸引眼球,能不能被外部认可。再好的技术,做出来无人关注也是不行的。一个团队的可持续发展,需要吸引人们的注意力。而这个项目,定位在跨越恐怖谷,如果能做出来,一定会非常吸引眼球。
为什么说恐怖谷会是一个吸引人的价值点呢?需要了解这一点,必须要讲一下恐怖谷理论。恐怖谷理论在1970年由日本机器人专家森政弘提出:
森政弘的假设指出,由于机器人与人类在外表、动作上相似,所以人类亦会对机器人产生正面的情感;直到一个特定程度,他们的反应便会突然变得极为负面。哪怕机器人与人类只有一点点的差别,都会显得非常显眼刺眼,整个机器人显得非常僵硬恐怖,使人有面对僵尸的感觉。可是,当机器人和人类的相似度继续上升,相当于普通人之间的相似度的时候,人类对他们的情感反应会再度回到正面,产生人类与人类之间的移情作用。
Wikipedia,https://zh.m.wikipedia.org/wiki/%E6%81%90%E6%80%96%E8%B0%B7%E7%90%86%E8%AE%BA
在电影行业,已经非常接近跨越恐怖谷的阶段,大量计算机视觉作出的虚拟人,在场景中和真实演员一起演出,粗看并无破绽。但电影毕竟拥有海量的资源,计算资源接近无限。而在实时渲染领域,并没有类似的技术,在计算能力受限,成本不高的消费者领域,缺乏同等级别的技术。如果通过这个项目能在实时内容领域产出足够高质量的技术,那么吸引眼球这个目标并不难做到。
综上,虚拟人这个想法,非常理想,符合上述所有条件。我们马上热血沸腾,和Epic一拍即合。
我们对项目目标的定义,是非常简洁的一句:Crossing the boundary。跨越影视和实时渲染边界,制作可实时交互的数字人物。
待续...
技术上的突破固然难得,创意上的突破也值得喝彩。请关注NEXT新作。
作者:顾煜
专栏地址:https://zhuanlan.zhihu.com/p/58419487
|
|