搭建GAEA,要解决两大难点
萧箫 发自 凹非寺
非常AI | 公众号 QbitAI
ChatGPT彻底引爆了AI领域,也点燃了各赛道玩家的热情。
以虚拟交互体验为例,就已经有不少新产品冒头。
不仅像Chat D-ID这类以ChatGPT驱动的虚拟女友bot花样百出,就连游戏AI NPC也变得火热起来,这几天知名游戏公司育碧要推出AI工具Ghostwriter一事,更是引起了巨大关注。
不过这些都还只是用AI驱动单人NPC对话。
如果能用AI操控NPC、甚至搭建出一个AI社会呢?
前不久,一个名为“活的长安城”的技术Demo引发讨论,其中NPC不仅全由AI操控,彼此之间还能互动:
要做的事也不会脱离性格和目标,如只想摸鱼翘班的捕快、立志当首席的舞女:
这场景,属实有点《西部世界》内味了!
但与《西部世界》不同的是,这些NPC没有预设剧本,也不会消除已有的“记忆”。
它究竟有何不同?又是如何运转起来的?
“活的长安城”,有何不同?
据上述Demo的发布方最新介绍,“活的长安城”是一个还在演进中的“AI社会”,背后由一个名叫GAEA的技术系统驱动。
(之所以还在演进中,是因为它只运转了30天,更像是一个社会雏形)
而以“活的长安城”为代表的“AI社会”具备以下特点:
- 包含一群身份多样、能互动的、受社会常识和反馈影响的AI
- 这些AI的生活环境开放,能受交互反馈影响产生文明,反过来影响AI未来生活
这也导致在身处“AI社会”的AI NPC,与其他虚拟世界如游戏中的NPC有很大不同。
首先,与众多为剧情设计的NPC相比,AI NPC有自己的目标和行动理由。
在不少游戏中,NPC的目的只是引导用户走完剧情,即便用AI生成对话,这一目标也不会改变。
但“AI社会”中的NPC不仅有各自的长期目标,当下也需要为生存等短期目标而考虑,换而言之,它们和人一样有需求,并根据性格和心情状态做出不同的行动。
此外,与其他游戏NPC不同的是,这些AI NPC还能“观察”其他角色的行动。
就像你走在大街上会观察路人一样,AI NPC也会在一定范围内观察你和其他NPC。如果有人吵架、或是举止异常,他们还会化身吃瓜群众上来围观。
最后,相比其他游戏NPC,这些AI NPC拥有社会常识,能“记住”看见和做过的事,并影响之后的行动。
例如舞女决定对路人出手援助,是因为她没有遇到过“受骗”的事情。如果她目睹或经历了类似事件,那么AI就会降低她援助别人的几率。
这些特点,也导致了“AI社会”不需要预设剧本,就能让AI NPC自己碰撞产生故事,积淀到社会中后又能回馈到NPC身上,反过来影响AI NPC的行动决策。
听起来很有意思,但具体到技术上,会发现实现起来并不简单。
拆解GAEA两大核心系统
从公开架构来看,GAEA分为灵魂系统和环境系统两个子系统。
这其中,灵魂系统相当于AI NPC的大脑和行动中枢,环境系统则包含“AI社会”的社会常识和物理信息等,它们彼此之间会相互影响交互。
先来看看灵魂系统,它被分为“记忆”和“策略”两部分。
“记忆”又分为内部状态和事件经历两个模块。内部状态用于建模AI NPC做事的“动机”,包含各种实时变化的状态值,如有钱就想摸鱼,不开心就想吵架:
事件经历则包括AI NPC一路观察或亲历的事情,用于给AI NPC的行动决策提供参考。例如AI小偷在大街上偷东西被捕快抓住过,它下次可能就不会在捕快出现的场景实施盗窃。
“策略”则分为上层宏观决策模型和下层交互模型。上层模型是一个长序列策略模型,它有点像AI的大脑,能够基于“记忆”中的社会常识信息+当下的环境系统做出决断,相当于给AI NPC制定一个整体计划:
下层交互模型则是通过符号系统建模的多任务模型,负责将上层模型做出的宏观决策进一步拆解细分,把整体计划变成一步步实际行动。
再来看看环境系统,它被分为“社会环境”和“物理环境”两部分。
“社会环境”包含了两方面的内容。
一方面,AI NPC之间通过交互和反馈生成的语言行为关系等信息,会被记录在这个系统里,持续影响AI NPC灵魂系统做出的行为决策;
(当然,灵魂系统驱使AI NPC做出的行动,也会反过来交互中对环境系统产生影响,形成系统自运转)
另一方面,它包含了运转“AI社会”所需要的所有人类社会常识,例如带有人类社会含义的状态标签(快乐、希望、金钱等)就包含在这个库中,而社会知识和规则也纳入其中。
“物理环境”就是场景中的各种物理数据了,包括风景建筑和商品水果等实物的建模信息、以及其他NPC的物理建模数据等,让NPC知道能与哪些场景数据发生交互,并指引它们做出具体的行动。
但即便GAEA背后的技术原理已经透露,具体如何实现让AI NPC“更像人”的效果,又是哪些关键技术提升了它的剧情生成细节,仍然是一个未知数。
带着这些问题,我们找到了GAEA背后的团队——超参数科技。
据其项目负责人张弛介绍,GAEA综合了不同模型能力,研发周期比想象中要长,大致分为两阶段:阶段一是搭建出完整的迭代场景和技术框架,也就是GAEA1.0;阶段二是着重提升GAEA的剧情生成和自然语言交互能力。
阶段一,团队主要依靠自研的AI BOT技术和长期实践积累的工程能力,一步步完成GAEA的技术选型,让虚拟场景“长安城”自运转起来。
这一阶段,不仅需要着重提升AI NPC的能力,包括丰富的行为表现和自然的语言交流等,来让它们看起来“更像人”,还需要不断改进技术方案和迭代路线,相当于将实验室的内容落地。在张弛看来,后者尤其难,不仅要考虑技术落地,还要具备从系统的角度思考整个NPC生态的产品思维。
他举例说,光是让NPC看起来“更像人”,涉及到的技术就不少。比如,让NPC根据昼夜等常识概念做出合理行动,涉及到模型对社会常识的理解与推理能力;给AI赋予“理想”和生存等现实目标,则要考虑建模NPC内在动机;而支撑NPC海量的行为表现,需要用到多任务强化学习等技术;而有效“记忆”信息提取,得通过特殊的编解码方式来解决……
阶段二,在系统已经能完整运转的基础上,团队引入了大语言模型来提升系统的生成效果。正如原理框架中展示,大模型提升了原有GAEA在目标拆解、AI常识推理和对话等模块上的能力,进一步提升系统的“转速”。
谈及下一步,张弛也做了小小透露,他说团队计划持续优化GAEA的技术细节,利用大模型去进一步提升NPC与真人交互的能力,以及整个生态的剧情生成能力,并对其他方向的AI NPC技术做一些预研布局。
当然,如何将GAEA输出到轻量化、可感知的产品上,建立合作机会,也是他们正在思考的方向。
公开资料显示,在推出GAEA之前,超参数科技已在“AI+游戏”领域取得成绩,包括率先在在3D FPS领域实现大规模商业化落地,AI bot在多款千万日活的头部产品中稳定运营,已经部署到全球50多个国家及地区等。
AIGC催生产业变革浪潮
AIGC这波浪潮推动下,各行各业正在迎来新一轮AI变革节点。
正如比尔·盖茨在《人工智能时代已开启》文章中所言,AI的到来将会极大地提升社会生产力,从而进一步改变人与人之间的交互方式:
整个行业都会围绕它重新定义。
一方面,AI的到来正在不断地提升社会生产力。
以大模型为例,它正在改变很多行业的工作方式、未来甚至能极大地提升行业的工作效率。
另一方面,对于产业本身而言,AI的出现又改变了人与人之间的交互方式,从而带来产品的新一轮爆发。
在红杉资本两位合伙人与GPT-3联合撰写的一篇名为Generative AI:A Creative New World的文章中,更是预测AIGC技术会如当年移动通信一样,诞生一轮“杀手级应用”。
简而言之,这些新技术的出现,不仅会给产品开发过程带来变革,催生出产品交互方式、乃至于产品本身的进化,甚至带来AI原生产品。
至于如何应对这波AIGC浪潮?有玩家选择All in新技术,开辟新场景;也有玩家质疑新技术应用前景,选择再观望一波。
超参数科技GAEA项目负责人张弛接受采访时表示:
随着技术迭代,市场的不断竞争,我相信大模型的调用成本一定会持续降低。
因此,现阶段该聚焦的还是如何在原有技术积累上用好大模型,做出完全不同以往的东西,给游戏或未来产品带来新的可能性。