Demo演示“游戏智能NPC”,AI已经能嘲讽人类了?
对于每一个游戏玩家来说,NPC(非玩家控制角色)或许都不陌生,你可以通过他们学习游戏操作、了解游戏背景、得到任务线索和物品,甚至有些开放世界游戏里,你还能培养不同NPC的好感度,发展友情、爱情。
但是,在目前绝大多数的游戏里,你都没办法和NPC真正的聊天,他们给人的感觉更多是被写入剧本的“工具人”,他们念着没有感情的台词、在固定的位置不眠不休地“被玩家搭讪”。
不过,随着技术的进步,越来越多的高品质游戏开始加入了更真实化的NPC,除了独特的个性、背景,甚至还能拥有自己的思维方式,或许会有一天,你甚至分不清游戏里哪个是真人玩家,哪一个是NPC。
不信?我们来看看Modbox开发者Alientrap通过将Windows语音识别、OpenAI的GTP-3 AI和Replica的自然语音合成等技术融合之后打造的demo:
有性格、会嘲笑你的NPC
这段Demo展示视频只进行了两段对话,从NPC的回答方式和语气来说,如果不是角色比较卡通,你很难判断他到底是真人还是AI,我们不妨分别看看两短对话的内容:
第一段对话是测试者与市政工作人员Bobby:
Bobby不仅说话有语气,还会用手比划
测试人:你好,Bobby。
Bobby:你想干嘛?(英文回答选择了What do you want?可以明显听出来有点不耐烦)
测试人:你要去哪?
Bobby:我要去上班,马上要迟到了,如果到公司晚了会被老板罚的。请走开吧,我现在没法帮忙。
测试人:你在哪上班?
Bobby:我在市政厅上班,位于城中心的一座政府大楼里,那是一座很大很漂亮的建筑,不容错过。
测试人:它在哪条街道上?
Bobby:你简直太聪明了,我喜欢你这样的!市政厅不就在市政路上(可能是在嘲笑测试者明知故问)。
测试人:好吧,再见。
Bobby:再见!
第二段是与卖热狗的小摊贩交谈,我们姑且叫他,热狗男(Hotdog Man)
带表情和肢体语言的热狗男
测试人:你好,热狗男
热狗男:您要点儿什么?
测试人:你这里都有什么类型的热狗?
热狗男:我们有三种热狗,普通的,甜的还有非常辣的。
测试人:能卖给我三合一口味的吗?
热狗男:不好意思,我们不能做这样的口味,客户不会喜欢的。
测试人:好吧,一个热狗多少钱?
热狗男:一个常规热狗6金币,甜热狗10金币,辣热狗9金币一个。
测试人:是什么让它这么辣?
热狗男:上面加了一点辣酱,所以非常辣。
从NPC回答的内容来看,无论是Bobby还是热狗男,都比绝大多数游戏里的NPC更“聪明”一些,而且其语言表达方式不仅能反映出角色个性、即时状态,还可以看出NPC与玩家之间的关系远近。
不过,从给出问题到通过GPT-3和Replica给出答案,往往有比较明显的延迟时间,尽管回答内容非常有个性,但这个等待时间还是会让人瞬间出戏。当然,比较好的消息是,随着技术的进步,这种延迟或被逐步消弭,比如谷歌和亚马逊已经在一些智能家用设备增加了定制芯片,以降低数字助手的反应延迟。
Demo背后的“黑科技”:GPT-3模型与自然语音合成
据GameLook了解,Modbox是一款支持SteamVR的多人游戏创作沙盒,经过了多年的公开测试研发之后于去年底发布,不过仍处于Early Access过程中,某种程度上来说,这个技术是领先于时代的。
在最近的测试中,开发商Alientrap使用了两种最先进的机器学习服务,包括OpenAI的GPT-3语言模型和Replica的自然语言合成。考虑到微软曾经给OpenAI投资10亿美元,并且拥有GPT-3的商业使用和源语言独占特权,所以该功能是不可能只用于Modbox。
2017年的时候,谷歌的AI部门公布了一个语言模型Transformers。在此之前,最先进的机器学习模型已经使用Attention的概念来获得更好的结果,但Transformers完全是围绕它而打造的,谷歌甚至将论文标题名命为“Attention Is All You Need”。
GPT-3论文截图
2018年的时候,埃隆·马斯克支持的OpenAI将Transformers方式应用到了一个新通用语言模型中,即生成式预训练(Generative Pre-Training,简称GPT),并且发现它可以预测很多句子里的下一个单词,还能回答一些多选问题。
2019年,OpenAI将该模型扩大了10倍以上,形成了第二代模型GPT-2,但他们发现,这种扩容大幅增加了系统能力,给出几句提示语,它几乎可以对任何话题写出文章,甚至还能翻译不同语言。某些案例中,写出来的文章甚至与真人无异。由于潜在的后果,OpenAI最初决定不将它发布出来,导致了大量的媒体报道和高级语言社会影响的猜测。
GPT-2有15亿个变量,但在2020年6月份,OpenAI再次扩容,将GPT-3模型里的变量增加到了1750亿个,它写出来的文章几乎全部都很难辨认出与真人写手的区别。
技术上来说,GPT-3是没有真正“理解力”的,因为如果放任机器自我思考,往往会带来荒谬或偏执的结果,尽管有时候这些互动可以带来趣味,但极端情况下会造成一些重大事故,比如曾有AI语音助手告诉某些人去自杀。
跟AI唠嗑现实吗?智能游戏NPC并不遥远
1931年,计算机科学之父“艾伦·图灵”曾提出一种测试机器是否具备人类智能的方法:如果一台电脑的表现(act)、反应(react)和互动(interact)都和有意识的个体一样,那么它就应该被认为是有意识的。
这就是著名的“图灵测试”。
如果按照这个标准,demo里的NPC无疑是有意识的,他们有自己的性格和说话方式。不过,与很多虚拟偶像或者智能语音助手“机器音”不同的是,Modbox创作的NPC说话声音已经很像真人。
如果看完了展示视频,你还能发现,无论是Boddy还是热狗男,每一个回答都有不同的语气,还会根据自己的心情和状态在说话中表现出抑扬顿挫。这就意味着,未来的游戏里,玩家们有望看到更智能的NPC角色,随着GPT语言模型的升级,你甚至能和AI聊很久。
不得不说,这个demo视频向我们展示了智能角色的潜力。随着AI回答延迟的降低,最终游戏里将会出现随口能回答问题,还带有自己个性和情绪的智能NPC,甚至,你都不知道和自己说话的,到底是真人,还是NPC。
····· End ·····