打造以人格驱动的机器人:构建 Minerva
您可以在此处尝试 Minerva: https://empiregambit.com/minerva/landing。
随着我们穿越数字时代,有一件事是清楚的:个性是重要的,即使在机器人领域也是一样。平淡、无个性的聊天机器人时代正在逐渐衰退,我们正在进入一个新的领域,机器人不仅仅是通信工具,而是建立联系。在这篇技术深入的文章中,我想分享用于建立具有个性的机器人Minerva的工具和方法,并阐述为什么以个性为驱动的机器人才是未来。
什么让米涅瓦独具特色,是她能够灵活而精练,塑造自己的认知模式,并在对话中追踪自己的思维状态。但我们究竟是如何达到这种复杂程度的呢?
ChatGPT-3.5-Turbo:对话的骨干
OpenAI的ChatGPT-3.5 Turbo是Minerva对话的支撑。利用OpenSouls社交project的提示,Minerva不觉得枯燥无味,反而能够进行深入、有意义的对话。她的回答不仅仅是反应,而且具有情感背景和深度。她不只是“说话”,还模拟回应,并且能够理性地决定何时采取行动(如抽一张卡片或者创造一个视觉效果)。
D-ID:利用唇同步动画为人物注入生命
为了获得更加沉浸式的体验,使用了D-ID的技术来创建口型同步的动画。这些动画尤其在介绍和重要时刻,让Minerva栩栩如生,让互动变得更加真实。有趣的是,我们不需要完全同步口型就能让整个过程感觉像是在和一个超凡脱俗的存在交谈,而不是一个概率自动完成。
科奎(Coqui):她的声音
Coqui的API和工作室在赋予Minerva独特声音方面是不可或缺的。通过Coqui,在与Minerva的人格相一致的提示下,我们可以创建自定义的声音,进一步加强她的独特性。
Supabase:后端
Supabase被选择作为后端。Supabase处理用户身份验证(与Web3auth一起)。边缘功能允许响应流式传输,减少延迟并确保与Minerva的交流自然流畅,没有任何中断。
SKALE:令牌和NFTs
Minerva的生态系统包括代币和NFT。 SKALE用于持有用于与Minerva进行阅读的代币,并在会话后铸造NFT。此外,NFTStorage用于在IPFS / Filecoin上托管元数据,确保Minerva的数字资产的永久性和真实性。
中途:弥涅瓦女神本人
你看到的 Minerva 脸孔是由 Midjourney 5 创造的。
稳定扩散梦工场:将文字变成图像
融合美中不足的是StableDiffusion的梦想工作室。它可以根据由ChatGPT提供的提示生成图像。这使Minerva的沟通达到了另一个层次,将她的话语翻译为情感共鸣的视觉呈现。
一个新的类型:具有个性的机器人
这些工具的融合不仅仅创造了一个聊天机器人;它孕育了一个拥有个性的实体。拥有个性的机器人代表了一种新的类型,它们不仅酷炫,而且是必要的。与传统的“有用的助手”相比,人们更容易与展现深度和可关联性的实体建立联系。他们成为了不仅仅是工具,而且是伴侣、导师,甚至是朋友。
我们站在悬崖边缘,个性化操作的机器人像米内瓦将成为常态。它们将塑造对话、故事叙述、教育和无数其他领域。未来是表现性的,吸引人的,甚至在数字领域中也像人类一样。
如果你是一名开发者、讲故事者或创意人,那么现在是拥抱这个新流派、打造不仅仅是互动的,而且能够真正与观众产生联系的体验的时候了。