ChatGPT Vision - 产品经理的五个真实用例(第一部分)

几周前,OpenAI宣布“ChatGPT现在可以看到、听到和说话”。ChatGPT的新功能终于为多模式带来了生机,您现在可以通过移动应用与ChatGPT的逼真合成声音进行对话(我将在以后的帖子中详细介绍),还可以将图像输入到对话中。

虽然听起来像是一个很酷的花招(而且确实很酷),经过一周的测试,我可以说这可能是自今年年初GPT-4发布以来最令人兴奋的进展之一。

如何访问ChatGPT Vision:

OpenAI正在逐步推出ChatGPT Vision(以及DALL·E 3和ChatGPT Voice)给ChatGPT Plus用户。如果你已经订阅,有可能你已经可以使用了。

确保你是:

  • 在GPT-4
  • 默认模式(在使用高级数据分析、使用必应浏览器、插件或DALL·E 3时,视觉尚不可用)
  • 您应该在输入栏中看到一个图像图标。
  • ChatGPT中文站
    ChatGPT on web browser

在移动设备上,视觉的包含更加显著,分别在左下角显示相机和图像图标。

一旦您拥有Vision访问权限,唯一的限制是每个提示最多四张图片。很快您就会发现,即使对于大量数据输入来说,这已经足够了。

没有访问ChatGPT Vision的权限?免费试试必应。

不,真的。微软已经与OpenAI合作,这意味着Bing可以访问GPT-4、DALL·E 3和Vision。根据我的广泛测试,虽然不如ChatGPT Plus好,但它非常接近。如果你不想为ChatGPT Plus付费,可以试试Bing。

使用此链接尝试Bing聊天。我推荐使用创意模式来进行几乎所有的使用场景。从这里开始描述的任何内容都可以在ChatGPT或Bing中使用。谢谢,Microsoft!

ChatGPT中文站
Bing Chat includes a Vision model. Use the camera icon in the bottom left of the input bar.

用例1:转录和转换笔记

想象一下:你在一个车间里。这真是太棒了。每个人都全神贯注,你有许多便利贴和文件要转录。当然,你可以手动完成这个任务,但视觉是一种超能力。

OCR(光学字符识别)已经存在多年,可能可以为您完成大部分转录工作。事实上,现在大多数智能手机只需查看照片就能复制文本。但是,使用Vision的真正价值在于利用ChatGPT对语言的内在理解,不仅可以转录您的笔记,还可以将它们转化为详细的以任务为导向的对话。

ChatGPT中文站
Photo by David Travis on Unsplash

我们可以从一个简单的例子开始。我找到了这张展示了八张便利贴的股票照片。Vision能够轻松地将它们转录出来:

ChatGPT中文站
ChatGPT Vision Conversation

太好了!即使它们不太清晰,它甚至能捕捉到墙上的七个。

让我们增加难度...

ChatGPT中文站
2x2 Prioritisation Method by Miro

这个矩阵不仅需要转录项目,还需要推测含义。每张便利贴的位置都表示它们在优先级矩阵中的放置。愿景也在这方面取得了杰出的成就。

ChatGPT中文站
ChatGPT Vision successfully transcribes each sticky note and understands the meaning of each quadrant of the matrix

这种方法可以扩展到包括更多细微和深度的图表和内容。而且,一旦这些内容在ChatGPT中,你可以与它进行对话。我们将那个2x2矩阵的输出转化为我们在一个冲刺计划中可以采取的行动,如何?

ChatGPT中文站
ChatGPT turning our prioritised tasks into a two-week plan (chat image edited to fit on screen)

这真正令人难以置信的一点是,ChatGPT直观地理解到“制作视频”本身并不是一个任务。它自动将其分为三个部分(策划和编写剧本、拍摄和编辑),然后在多天内进行计划。这就是人工智能的真正价值所在。我甚至可以进一步说“让我们从冲刺的第一天开始,帮助我计划我的社交媒体帖子”,等等。通过创建一次连贯的面向任务的对话,您可以从简单的输入中获得令人难以置信的价值。

作为我的最后一个杀手锏,让我们让ChatGPT将所有这些添加到我的日历中,这样我就可以更轻松地追踪任务了。

ChatGPT中文站
ChatGPT can generate code. Calendar import files are code. So it is entirely possible to ask ChatGPT to add to your calendar based on your natural language conversations.

然后在将该ics文件导入到Google日历后,我有两周的事件计划。我可以根据需要重复此方法(或者要求ChatGPT给出不同的格式,比如JIRA的.csv文件)。

ChatGPT中文站
After importing the .ics file into Google Calendar it successfully added the tasks from the 2x2 matrix in an order that makes sense

您甚至可以进一步深入使用。既然日程已经安排好了,那就让ChatGPT参与到能推进工作的谈话中吧。我常常建议人们将ChatGPT视为团队中的一名同事。与他们交谈,提问,征求他们的意见,共同努力使你的创作变得更好、更快。你与ChatGPT就一个特定背景进行更长时间的对话(填满上下文窗口),ChatGPT就会变得更加相关和有见地。

为什么这很重要?

作为产品经理,我们负责构建能解决客户问题、受人喜爱并推动业务发展的产品。为了实现这一目标,我们经常与客户交流,制定产品路线图,举办研讨会和创意会议,绘制客户旅程图,制作原型等等。几乎可以说产品经理所做的事情应有尽有。然而,其中很多任务都是可视化的。当然,你可以用文字来表示其中大部分内容,但人类是多模式的:我们使用文字,同时也看见、听到和触摸真实世界。当我们能够以与我们感知方式一致的方式与AI代理和系统交互时,我认为我们不仅可以提高生产效率,还可以获得更真实的互动体验。将图表展示给ChatGPT,并在对话中和它进行迭代比起写一段文字并接收一段文字回复更为自然。

当您可以接受研讨会或产品文档的输出并理解它时,您可以加快整个过程的每一步。在某些情况下,比如转录,您实际上是在节省时间。您可以将这些时间投入到更重要的工作中。而在您可以改变工作的情况下,您可以成为一个混合型项目经理。与人工智能并肩工作,以更快、更有创造力和以新的、有趣的方式进行工作。

接下来是什么?

这只是冰山一角。自从我获得使用ChatGPT Vision以来,我已经广泛使用,并且有几个深入使用案例要分享,我相信这些案例可以改变产品经理的工作方式。我将每周发布一个深入使用案例,共发布五周,我的文章将提前一周在我的Substack上发布。在Substack上订阅以免费立即获取我的文章。

2023-10-20 17:22:18 AI中文站翻译自原文