如何在只需15分钟内使用GPT-4分析成千上万个开放式调查问题?以下是您的终极指南!

概述:在调查中,开放式问题包含非结构化数据,给数据分析带来了挑战。传统的NLP分析方法存在一些缺点。但是,通过GPT-4,您可以在仅需15分钟内实现高质量的分析,预计成本不到一美元。

我在硅谷的一家在线教育公司工作。我们的学生遍布全球。我们通过调查收集反馈意见。调查中有三个开放性问题。每个月,我们收到数以万计的答案。分析这些问题的反馈意见一直是个巨大的挑战!

但是有了GPT-4,分析这数以万计的非结构化数据条目只需15分钟,并且成本低于1美元。

那么,流程是怎样的呢?如何制作有效的提示?让我给你分解一下!

这三个问题是:

  • 您对这次经历有什么喜欢的地方?
  • 请提供一个示例,说明您打算如何应用或已经如何应用您在工作中新获得的技能(如果您有打算的话)。
  • 你认为我们应如何改进您的体验?

以前,我们必须根据学生的特点,如雇主,手动组织答案。这是费时、劳动密集且不精确的。但是随着ChatGPT的出现,我有一个想法 - 我们能否利用ChatGPT的能力呢?

答案:绝对可以!而且它非常强大。

我在一个样本数据集上使用GPT-4进行主题建模的实验。

步骤1:前往“高级数据分析”,然后上传您的数据。

购买Chat GPT Plus后,进入GPT4界面,打开“高级数据分析”功能,并上传您的数据文件。我上传了一个包含20个开放性问题的Excel文件,每个问题收到20-25条文本回答。GPT-4首先提供基本分析,例如行数和列数。

ChatGPT中文站
Enter the GPT4 interface, turn on the ‘Advanced Data Analysis’ feature

第2步:主题建模分析呈现五个关键主题。

我首先让GPT-4对数据进行主题建模。主题建模是一种自然语言处理技术,用于从文本集合中提取最重要的主题。

经过尝试多个提示后,我发现:

只是询问GPT-4进行主题建模,结果会导致其建议使用传统的NLP方法,提供Python代码,或者引导用户使用Google Cloud的BERT模型。而这些传统方法并不出色。

因此,我提供了一个详细的提示: “您能使用GPT-3.5-turbo或GPT-4模型进行分析吗?请避免使用潜在狄利克雷分配(LDA)或任何外部或传统的自然语言处理方法。”

2. GPT-4每次只能分析一个问题。因此,我指示它从最关键的问题开始:“你如何建议我们改进您的体验?”

在完善了提示后,结果令人印象深刻。GPT-4识别出了五个主要主题,如课程内容和结构以及技术和与IT相关的反馈。对于每个主题,它提供了一个摘要以便更好理解。

步骤3:为每个主题提供示例。

对于用户来说,除了概览之外,他们可能还想看到每个主题下包含的具体答案。为了满足这种潜在需求,我使用了第二个提示:您能否为我分享每个主题的3个例子?

步骤4:每个主题对应多少个回应?

在确定了五个关键主题之后,了解哪些主题有更多的反馈是至关重要的。然后,我指导GPT-4分析这些反馈并生成图表,导致GPT-4迅速生成了以下图形。

ChatGPT中文站
Bar chart generated by GPT4 to illustrate how many responses are associated with each theme

使用GPT-4的API进行成本分析?

总结这个简单的分析,我计算了使用GPT-4 API而不是聊天界面的代币消耗和成本。整体费用非常低廉!

出现了一个关键问题:上传的数据大小是否会影响令牌消耗?我向ChatGPT提出了疑问:“如果我上传的文件有20,000行,与只有200行的文件相比,假设相同的提示和预期的回复,令牌消耗会有所不同吗?”

ChatGPT回答说:“GPT-4(或GPT模型的任何变种)中的令牌消耗与输入(您的提示)和输出(模型的回答)直接相关。文件大小或行数并不直接影响令牌消耗。”

本质上,对于所有用户数据的月度分析,成本低于0.30美元。即使我们假设有100个企业客户,并为每个客户生成一份报告,总成本也只有3美元。

这就是科技带来的力量和变革!

除此之外,我还尝试了GPT-4用于情绪分析和其他领域的实验。由于篇幅限制,我将在未来的帖子中分享这些内容!

ChatGPT中文站

2023-10-20 17:22:23 AI中文站翻译自原文