|
刚到龙年,“AI内容生成”的新消息,就在游戏行业掀起了巨大的波澜。
2024年2月16日,Open AI公布了文字转视频大模型SORA,在极短的时间之内,就引起了全球科技媒体广泛报道,同时在无数内容创作者社区掀起了前所未见的巨浪:
如果说2023年的“文字转图片”技术早已让我们审美疲劳,那么随着SORA的登场,仅需提示关键字就能生成长达60秒的连贯视频,如此离谱的效率,显然超越了不少流媒体时代Vloger的心理预期,“AI取代人类”的忧虑,一夜之间卷土重来。
事实上,不仅仅是影视行业,就连看似没有直接关联的游戏业,也随着这一轮的舆论风口,响起了不少争论的声音——再联想到今年年初,似乎有报道表示“Valve放宽了对AI生成内容的管制”,以及有新闻声称“Level-5(《妖怪手表》的制作商)已经在开发过程中引入了AI内容生成技术”,一个十足现实的问题,俨然已经是近在眼前:
“游戏产业即将迎来AI革命”,究竟是夸夸其谈,还是确有其事的客观事实?
SORA的真面目?
在AI内容生成领域,“文字转视频”其实并不是什么前所未见的新概念,诸如Stable Video Diffusion和Pika等项目,已然让我们见识到了这个产品方向的旺盛潜力——不过即便如此,尽管独创性并没有想象中那么突出,但和同类产品相比,在技术层面,SORA确实不乏后发优势:
首先,在算法层面,SORA融合了diffusion和transformer两种架构,生成的视频内容在理论上不再有分辨率、时长以及尺寸一类的限制——前提是硬件性能跟得上;
其次,通过对captioner model和prompts扩写等技术的引入,SORA可以更融洽地关联提示文字和生成效果,有效提升视频成品的内容质量——之所以SORA仅凭一段60秒时长的演示视频就能聚拢全球科技媒体的目光,“第一印象十足好看”的内容生成效果,显然正是主因。
不过,倘若就此认定,“SORA已经能够取代专业动画乃至影像从业者的工作”,那显然依旧是为时过早:
还是以SORA反响最大的“东京街头漫步”AI视频为例,尽管单从截图乃至Gif片段来看,无论光影还是纹理效果都已经达到了近乎乱真的地步,但只要看过完整全片就知道,内容生成AI常见的“肢体扭曲”现象并没有在这部短片中缺席,甚至还达到了变本加厉的程度:漂浮感十足的步伐仅仅是小问题,行进间双腿莫名其妙的“交织混淆”、仿佛软体动物一般扭曲蠕动的奇景,只怕对于大多数人都是过目难忘——再考虑到所有画面都是AI“取代人工”生成的结果,我们基本可以看到一个明确的阶段性结论:
至少在目前这个阶段,哪怕是正在风口浪尖的SORA,想要彻底取代创作者的才华与创意,持续迭代进化依旧不可或缺。
至于理由,其实并不复杂:
说到底,SORA的基本原理,依旧仅仅是通过样本视频学习了现实世界规律的“表征”,达到了“知其然”的程度,在细节上不可能模拟真实世界的物理规律,距离“知其所以然”的拟真化,依旧有不小的差距——换句话来说,尽管有报导声称,SORA可以在没有明确数据标记的前提下,仅凭规模效应“涌现”生成某些超乎预期的画面,但除了刻意为之追求猎奇噱头的玩票爱好者,这种带有鲜明“AI滋味”的动态画面,恐怕很难在专业化应用领域(包括但不仅限于教育、培训以及广告宣传)发挥预期中的功效。
“好用,但也没那么好用”——这种“雷声大雨点小”的基调,正是目前的内容生成AI在大多数应用领域面临的窘境;不仅是图文视频,在游戏开发领域,AI应用的局限性,基本如出一辙:
AI应用,不见得高人一等
事实上,哪怕是内容生成AI明确参与制作、拥有可观人气反响的热门作品,只要点开惊世骇俗的标题细看报道内容,十之八九都能找到“不尽如理想化预期”乃至“毁誉参半”的真实反馈:
以洛杉矶Corridor Digital工作室出品的《ANIME ROCK, PAPER, SCISSORS》为例,在2023年3月刚刚上线的时候,这部标榜“内容生成AI深度参与制作”的短片,曾经在不少社交媒体产生了巨大的反响——至少在垂直领域,轰动程度丝毫不逊于如今的SORA;但与此同时,许多动画行业的从业者,不约而同地对这部“作品”流露出了毫不遮掩的厌恶:
“一帮懒惰、无耻、对着动画艺术形式吐口水的小偷!”
这便是动画版《恶魔城》的导演Samuel Deats,对《ANIME ROCK, PAPER, SCISSORS》及其背后制作团队留下的点评——正所谓窥一斑而知全貌,动画领域专业人士的态度,基本如上。
需要强调的是,这并非毫无根据的妒忌乃至“对新生技术的恐惧”——之所以《ANIME ROCK, PAPER, SCISSORS》能够摆脱“猎奇”的水平进入“能看”的范畴,正片相对统一的画面风格自然是主因;而这种相对稳定的画风背后的成因,其实完全没有半点神秘感可言:
在为本片训练AI时,Corridor Digital选择了Madhouse出品的经典赛璐珞动画《吸血鬼猎人D》作为样本,从而实现了华丽且较为统一的视觉风格——换言之,如果没有这种近乎以帧为单位进行摹仿的“借鉴”,如果没有Madhouse在20年前竭尽心力创作出的传世杰作,《ANIME ROCK, PAPER, SCISSORS》想要从构想化作现实,显然断无可能。
“尽管对于Corridor Digital 的粉丝来说,《ANIME ROCK, PAPER, SCISSORS》背后的AI技术似乎很有吸引力,但就实质而言,这个团队利用AI技术进行的‘创作’,是对动画行业的又一项有害创新——这种偷窃的艺术家创作的行径,和现实中偷窃艺术品的罪行没什么差异。”
——看看Kotaku对《ANIME ROCK, PAPER, SCISSORS》给出的评价,“AI生成内容取代艺术家创作”究竟有几分属实,相信大家心中有数。
相比于毁誉参半的“创作工具”,把AI生成内容视作“辅助手段”的思路,风评明显要好得多——实际上,游戏行业现如今甚嚣尘上的“引入AI内容生成技术”,到头来基本上都能绕回这个原点。
还是以前面提到的Level-5为例,从相关报道的实际内容来看,AI内容生成的实际应用范畴,大致如下:
为游戏新作生成宣传图示意草稿,方便开发组从中获取灵感绘制最终成品图;
利用AI技术运算提升画面分辨率;
绘制游戏背景图素材,包括建筑群落以及人群等等;
除此之外,Level-5对AI的应用还包括合成游戏角色临时语音、通过与ChatGPT进行交流来“探讨”角色设定的思路灵感,以及利用AI编程辅助工具来生成代码并完善游戏描述,从而提高网站建设的效率——总体来说,AI生成内容确实在Level-5的生产力规划中占有一席之地,至于实际地位,相信大家有目共睹。
至于Valve,尽管在名义上放松了对AI生成内容的管制,但在官方Blog推文中,V社明确指出了AI应用的实质范畴:
1.预生成内容:在游戏开发过程中借助 AI 工具生成的内容(艺术作品/代码/音效等)。在《Steam 分销协议》中,各位曾向 Valve 承诺自己的游戏不会包含非法或侵权内容,且游戏将与营销材料保持一致。我们在发行前的审核过程中,将会评估游戏中的 AI 生成内容,所采取的条件与评估所有非 AI 生成内容完全一致——其中一项便是检查游戏是否符合上述承诺。
2.实时生成内容:在游戏运行过程中借助 AI 工具生成的内容。除了须遵循与预生成内容一样的规则外,此类内容还须满足一项额外条件:在内容调查中,各位需要告知我们你对 AI 技术采取了哪些保护措施,以确保其不会生成非法内容。
Valve表示,以上条目将成为Steam平台游戏内容的新审核项目,相关游戏信息将会在Steam商店页直接公布,便于玩家了解中意的作品是否包含AI生成内容;除此之外,通过Steam平台启用的新系统,玩家还可以对游戏内违法的AI实时生成内容进行举报,有效避免AI技术的有害滥用。
那么,除了以上这些“配菜”性质的辅助应用,AI内容生成究竟有没有为游戏业贡献实质化生产力的实例?答案当然是肯定的,但效果也是尽在预料之中的:
2023年,Nvidia联手Convai,推出号称“一站式完成游戏NPC创建”的AI工具,Omniverse Avatar Cloud Engine——根据官方描述,凭借这款AI解决方案,游戏制作者可以不费吹灰之力让自己游戏的NPC拥有栩栩如生的动作表演、台词对白乃至剧情动画,俨然是“AI赋能游戏产业”的杰出表率;
然而,随着这款“革命性的AI应用”在CES 2024上公布了可玩演示,所有满怀期望前去围观的媒体和参观者,不约而同地大失所望:
哪怕以最宽容的标准来看,Omniverse Avatar Cloud Engine实际呈现的效果,基本也和标准的AI聊天机器人不相伯仲;平仄不分的语调再加上极不自然的角色动画,直接让最终实现的画面效果成为了在恐怖谷边沿反复横跳的巨大黑色喜剧——不得不说,对于超自然惊悚主题的作品而言,这种诡异感十足的效果还真可谓是相得益彰,至于其它类型,只能说,暂时还是省省吧。
尽管假以时日,凭借兼顾规模与深度的训练,Omniverse Avatar Cloud Engine确实有潜力达到尽善尽美的水平,不过,考虑到就在这款工具于2024年正式亮相的两周前,整个游戏行业迎来了一波范围极广的裁员,究竟还能不能有源源不断“出自人手”的样本供AI大模型进行训练,说实话,真有点耐人寻味。
AI必胜?未必是定论
“内容创作AI是最好的B-Roll创作工具。”
这是Youtube博主Paddy Galloway,对SORA这一波热潮给出的评论。在某种程度上,将其视作C端用户和自媒体创作者的真实感受,基本合乎预期。
实际上,如果让我们冷静下来重新审视这一波“AI崛起”的舆论浪潮,大多数朋友应该不难发现,单从宣传口径和造势力度来看,AI创作内容的这一波声势,和近几年潮起潮落的一系列网红科技新突破是何其相似——如出一辙的博人眼球宣传片,照本宣科的“重塑行业”和“改变世界”,至于说潮水褪去后,这些曾经红极一时的噱头还能剩下什么,咱们应该有目共睹。
在笃定“这一波一定能成”准备全副身家All In之前,稍退半步从全局层面把整个项目重新审视一番,未必不是个好主意——区块链如此,元宇宙如此,AI生成内容,同样也是如此。
文/西北偏北
原文:https://mp.weixin.qq.com/s/EYwDXTWYaSs7GKIoq9e-dQ
|
|