每日聚焦:英伟达:AI扮演的NPC难辨真假

有很多方法可以让你与大型语言模型进行文字聊天,从ChatGPT到Google Bard或MLC LLM,一个可以在你的手机上运行的本地聊天机器人。人工智能的下一个前沿是将LLM的力量带给游戏中的NPC(非玩家角色),在那里,你可以有一个广泛的对话,而不是有一套罐头式的互动。

在Computex 2023年的主题演讲中,英伟达首席执行官黄仁勋发布了ACE for Games,这是一项人工智能模型代工服务,旨在利用自然语言对话、音频到面部表情和文本到语音/语音到文本的能力,使游戏角色变得生动。黄展示了一个游戏演示,其中一个名为Jin的NPC经营着一家拉面店,他与一个人类玩家互动,后者用语音提问,并得到符合NPC背景故事的真实声音的答案。


【资料图】


在演示中,玩家(名为Kai)走进Jin的拉面店,问他做得怎么样(用语音),并就该地区犯罪率高的事实进行了交谈。凯问他是否能提供帮助,金回答说:"如果你想对此做些什么,我听说有传言说,强大的犯罪头目青木公明在这个城市里造成了各种混乱。他可能是这种暴力的根源。"凯问在哪里可以找到青木,金告诉他,让这个用户开始了他的探索。

Nvidia ACE for Games将提供对已经存在的三种不同组件的高速访问。第一个,Nvidia NeMo,是一个用于训练和部署LLM的AI框架,它包括NeMo Guardrails,旨在防止不适当/"不安全 "的AI对话。据推测,这将阻止NPC回答来自用户的不适当的、偏离主题的提示。Guardrails还具有安全性,应该可以防止用户或可能的提示注入者 "越狱 "机器人并让它们做坏事。

Nvidia Riva是该公司的语音到文本/文本到语音解决方案。在ACE的游戏工作流程中,玩家将通过他们的麦克风提出一个问题,Riva将把它转换成文本,并反馈给LLM。然后,LLM将产生一个文本响应,Riva将其转回用户将听到的语音。当然,我们希望游戏也能以文本形式显示回应。  你可以在该公司的网站上尝试Nvidia Riva的语音转文字和文字转语音功能。

Nvidia Omniverse Audio2Face为游戏的ACE工作流程提供了最后一步,因为它可以让角色的面部表情与他们所说的内容相匹配。该公司目前提供该产品的测试版,你可以在这里试用。


这个名为Kairos的演示是由Convai设计的,这是一家人工智能游戏初创公司,是Nvidia的Inception计划的一部分,该计划将新兴公司与风险资本联系起来。在该公司的网站上,它提供了一个工具集,使游戏开发者能够建立具有复杂背景故事的逼真的NPC。

该公司有一个很好的解释视频,介绍其工具如何工作以及它们能做什么。在视频中,你可以看到玩家与NPC交谈,要求他们做涉及游戏中实际物体和其他角色的事情。

例如,在视频中,一个玩家要求一个NPC把放在桌子上的枪交给他,NPC答应了。在视频的另一部分,玩家要求一个士兵NPC向位于一个特定地点的目标射击。我们还看到Convai的工具是如何使这一切成为可能的。

有了这种额外的背景,使NPC意识到游戏中发生的事情是如此重要。最近,我们测试了一个Minecraft的人工智能插件,它允许你与游戏中的NPC交谈,但NPC根本就没有情景意识。例如,我们能够在杀死一只羊之后继续与它对话(它不知道自己已经死了)。