在五分钟内构建一个定制训练的聊天GPT。
本文将教您如何在5分钟内运行一个基于您自己数据训练的本地聊天GPT。自定义训练的LLM机器人可以用于扫描大量数据并进行特定领域的对话。例如,您可以在公司知识库、教育材料、金融/法律甚至是分享您的旅行想法以规划完美路线的过程中训练您的机器人。?
这个可以在5分钟内完成;让我们开始工作吧。
先决条件:
- 本文假设您已经安装了Python 3.*.*和Pip(可以在这里下载)。为了验证此事,请打开终端并输入:python --version OR python3 --version。如果您已经正确设置了,应该会返回类似以下内容的结果:
请确保在整个指南中始终使用正确的Python引用。
- pip --version 或 pip3 --version。如果你已正确设置,你应该会得到以下类似的返回信息:
(请确保在本指南中始终使用正确的 Pip 引用)
- 本文假定您已经拥有OpenAI账户(可以在此处创建)。
- 准备一些英语数据。我建议从少于100MB开始,慢慢添加更多。例如,数据可以是PDF,CSV或TXT格式。
让我们开始吧。
(1)在终端中:
- 升级Pip(Python包管理器):python -m pip install -U pip
- 安装以下库:pip install openai gpt_index==0.4.24 langchain==0.0.118 PyPDF2 PyCryptodome gradio
OpenAI — 大型语言模型(LLM)用于创建和训练AI聊天机器人。GPT Index — 用于连接您的数据。PyPDF2 — 用于处理PDF文件。Gradio — 聊天机器人UI。Lang Chain — 由语言模型驱动的应用程序开发框架。
- 现在让我们创建您的机器人。导航到您想要创建机器人的文件夹:mkdir chatbotcd chatbotmkdir docs创建app.py文件。
(2)在您喜欢的代码或文本编辑器中打开app.py,将以下代码粘贴到其中,然后保存它:
from gpt_index import SimpleDirectoryReader, GPTListIndex, GPTSimpleVectorIndex, LLMPredictor, PromptHelper
from langchain.chat_models import ChatOpenAI
import gradio as gr
import sys
import os
os.environ["OPENAI_API_KEY"] = 'Your Secret API Key'
def construct_index(directory_path):
max_input_size = 4096
num_outputs = 512
max_chunk_overlap = 20
chunk_size_limit = 600
prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)
llm_predictor = LLMPredictor(llm=ChatOpenAI(temperature=0.7, model_name="gpt-3.5-turbo", max_tokens=num_outputs))
documents = SimpleDirectoryReader(directory_path).load_data()
index = GPTSimpleVectorIndex(documents, llm_predictor=llm_predictor, prompt_helper=prompt_helper)
index.save_to_disk('index.json')
return index
def chatbot(input_text):
index = GPTSimpleVectorIndex.load_from_disk('index.json')
response = index.query(input_text, response_mode="compact")
return response.response
iface = gr.Interface(fn=chatbot,
inputs=gr.components.Textbox(lines=7, label="Enter your text"),
outputs="text",
title="Custom-trained AI Chatbot")
index = construct_index("docs")
iface.launch(share=True)
(3) 现在将您的数据文件移动到新创建的/chatbot/docs文件夹中。
(4) 在浏览器中:
- 通过转到以下网址获取OpenAi的免费API密钥:https://platform.openai.com/account/api-keys
- 如有需要,请登录。
- 点击“+ 创建新的秘钥”。
- 给你的密钥命个名,然后点击“创建密钥”。
- 复制该密钥并保存以备下一步使用。
- 将密钥粘贴到app.py中,替换“您的秘密API密钥”。
(5)回到/chatbot/文件夹的终端,运行:python app.py。
(6) 打开您最喜爱的浏览器,然后打开此链接:http://127.0.0.1:7860
完成了!你应该看到类似这样的内容:
现在就由您来寻找有价值的信息来教授您的机器人,并学习如何从中受益。