ChatGPT UI 用于视觉决策制定。
聊天机器人不够有用
我们做出很多决定,无论是买鞋还是买房,决定这个周末该做什么或者我们的人生应该怎样,选择看什么电影或上哪所大学。我们经常陷入困境,不确定自己想要什么。
在这种情况下,与专业人士或朋友头脑风暴非常有用。幸运的是,我们第一次拥有了销售人员、房地产经纪人、职业顾问、生活教练、财务顾问、营养师、婚礼策划师、治疗师、导师、朋友等,都融为像ChatGPT这样的综合性服务。但它看上去并不像这些,它看上去像一个空的聊天框,上面有一个闪烁的光标。
因此我们不会向ChatGPT寻求购买鞋子或计划周末活动的建议。 我们很难提出相关问题或想出创意提示。 此外,我们不指望ChatGPT拥有关于房地产列表或当地事件的特定知识,进一步限制其有效性和影响范围。
但它可以变得更好。
这就像是1997年的Google。Pagerank是新的技术。第一款产品是10个蓝色链接。令人难以置信的是,我们惊叹于其速度和将网络带到我们指尖上的方式。然而,搜索演化的后20年更多地是基于一个明显但未被认识到的平台。该平台是SERP(搜索结果页面)。它允许存在和协作的数百个功能,例如知识面板、新闻旋转木马,最终还有诸如体育、选举和健康等专业垂直领域,这些都开始满足用户更深层次的需求。所有这些都与基于PageRank排名的通用搜索相结合,但平台本身才是更具启示性的。
"滑动式"决策
我开始建造一个类似于SERP的平台来解锁LLM的潜力,以帮助实际的决策任务。该应用程序的核心是一个业务逻辑层,其中包含两个同时进行的对话-一种可视化、感知、交互式的对话“向上”与用户,另一种对话“向下”与LLM通过与用户交互对齐的可适应提示。前端还从Unsplash拉取图像和结构化数据从SERP API,并且后端是一个基础LLM,现在将通过库存和评论进行微调。
大部分决策任务都使用相同的基本工具箱技术,这就使得从少量核心提示中进行概括成为可能。这些技术包括推荐和对选项作出反应、查看他人对某个选项的评价、比较选项以建立心理模型等等。
证据点
初始演示是针对“周末该做什么”的用例。结果非常显著。
虽然我们可以提供标准偏好,例如“有孩子”和“户外”,但它也邀请我们通过提示“你在想什么?”分享抽象和微妙的想法。在我的情况下,这恰好是“BLM”和“它在下雨”。它似乎理解这些想法的影响,并推荐了相关的本地活动,例如“参观加利福尼亚州奥克兰博物馆了解该地区的民权历史”和“在奥克兰公共图书馆参加有关民权主题的讲座或研讨会”,考虑到当时我在奥克兰的位置。整个体验非常令人印象深刻,带有惊人的效果。
另一个时候,我的目标是“我想与孩子一起学习新东西,在帕洛阿尔托附近”,其中之一的建议是“圣何塞的湾区玻璃学院提供各种玻璃制作课程和工作坊,包括吹制玻璃、熔接以及琉璃工艺。这可能是一个适合有年龄较大的孩子家庭进行的有趣而独特的活动。”我从未想过与孩子一起去周末参加玻璃吹制课程。相反,谷歌提供的网络和本地搜索结果虽然很有用,但常常感觉普遍和缺乏LLM所提供的个性化见解。
它能够结合“室内”和“活跃”等高级线索,来暗示“攀岩”、“激光枪游戏”和“室内风洞”,使其比简单的分类搜索更加强大,因为LLM了解每种活动的属性,并能够分辨哪些是室内和活跃的。
即便是选择要探索的决策旅程的初步任务,也可以受到相同的决策框架的影响。ChatGPT能够提供需要合作头脑风暴的决策挑战的示例,并将它们按照不同的轴进行组织。
LLMs在有效引导时可以变得强大和有用。
愿景
虽然谷歌是一个搜索和回答引擎,而ChatGPT是一个对话引擎,我们提出的应用程序是一个决策引擎。对于像“本周末要做什么”的查询,谷歌呈现了一个Bar'd“答案”及一个广泛的选项列表,并且有数百个搜索结果,但我们必须选择一个。ChatGPT提供了强大的自由形式聊天功能,但也将责任放在我们身上,以驱动提示和缩小到最终决策。而决策引擎积极推动决策驱动流程并提供各种形式的帮助。
请想象一款视觉丰富、互动性强的应用程序,围绕着LLM建立,像销售人员或房地产经纪人一样为您提供指导。它欢迎您进入虚拟商店或办公室,收集您的高层次输入,提供几个初步的选择,并根据您的互动了解您的偏好。它利用其对每个领域的深入了解,温和地提供见解和选择,但保持平衡的对话,给您探索的空间。它主动总结客户评价并进行比较分析,以便发现关键元素,从而为您提供信息和教育。它是一个有状态和个性化的平台,记录您在几天或几周内的进展。它帮助您从零开始进入一个有意义且迷人的决策之旅,认识到即使选择决策路径本身也是一种决策。
它驱动着体验,让你不必跟上聊天机器人对话引擎,而且它是交互式的,所以你将得到专属的回复,而不是像搜索答案引擎一样需要逐个查找链接。有了SlideInto.AI,我们为人工智能建立了一个UI的开端。用户们,坐下来享受旅程吧。读者们,请告诉我你们的想法!