每周AI和NLP新闻 - 2023年6月20日

ChatGPT的价格降低了，GPT-4现在可以使用第三方功能。

以下是由NLPlanet为您精选的NLP和AI的每周文章、指南和新闻！

?来自网络的新闻

功能调用和API更新。OpenAI发布了几个新的更新，包括GPT-3.5-turbo的16k上下文版本，用于调用用户定义函数的新API，模型和输入标记的成本降低以及GPT-4和GPT-3.5-turbo的更新版本。这些更新旨在改善GPT的功能，使其更容易与外部工具和API连接起来。
第一个基于Yann LeCun视觉的面向更加人类般AI的AI模型。 I-JEPA模型采用自我监督学习，捕捉关于世界的常识知识，并避免生成方法的局限性。 Yann LeCun关于人类般AI的愿景是该模型的基础。
Google Lens现在可以搜索皮肤情况。Google Lens现在具有一种功能，即通过分析上传的图像来识别皮肤情况和其他身体不适。该功能可以与聊天机器人集成，为照片中的对象提供准确的答案。
欧洲在人工智能法规方面取得进展，挑战科技巨头的权力。欧洲议会已批准了欧盟人工智能法案，以调节人工智能，保护消费者免受诸如歧视和错误信息等风险。该法案禁止某些工具，并设定高风险技术的限制，通过透明和基于风险的方法促进负责任的人工智能开发。它还可能影响国际政策，并敦促公司朝着统一的监管格局发展。
保持 HTML 结构，将以下英文文本翻译成简体中文：保罗·麦卡特尼（Paul McCartney）借助人工智能录制了一首甲壳虫乐队的歌曲。保罗·麦卡特尼使用 AI 技术恢复了约翰·列侬的声音，并从一盒标有“给保罗”的 1978 年的卡带中录制了一首甲壳虫乐队的歌曲。这次合作展示了人工智能在音乐保护方面的潜力，并为未来的艺术家和粉丝打开了新的机遇。
人们正在通过抓取公开的 API 密钥来盗版 GPT-4。OpenAI 警告称，被窃取的 API 密钥正在被广告用于未经授权的访问 GPT-4，这可能导致账户持有人面临意外费用。建议用户保护好他们的密钥，如果密钥暴露了，立即更换。自动扫描将被用于吊销已确定的暴露的密钥。

? 来自网络的指南

LLM中的100K上下文窗口背后的秘密酱汁：所有技巧都在一个地方。研究人员已经开发出了优化技术，以使大型语言模型能够训练更长的上下文长度，包括用ALiBi替换位置正弦编码、使用稀疏注意力、采用FlashAttention、实现多查询注意力以及使用条件计算来优化速度和准确性。这些技巧使训练范围扩展到100K令牌，从而更容易生成更长的文本。
利用猎鹰40B 型号，最强大的开源LLM。猎鹰40B 是一个强大的开源LLM，在AI社区中引起了轰动。使用Hugging Face的本指南可以帮助爱好者和专业人士开始探索其潜力而不受阻碍。
如何运作GPT：药水寓言，形容关键词、值、查询及关注的关系。本文解析了GPT模型如何应用关键词、值以及查询在关注中理解文本中单词的背景。作者使用了制药的比喻来描述这些元素如何协同工作。理解这种互动有助于预测下一个单词和上下文的连贯性。
如何我和我的网友使用人工智能。本文讨论了AI在提升生产力和创造力方面的真实应用，例如ChatGPT和DALL-E 2。AI非常适用于生成想法和视觉效果，但应与个人的精髓相结合，共同创造出卓越的内容。
GPTeam: 一种多智能体模拟。GPTeam 是一种开源的多智能体模拟，灵感来自于斯坦福的“生成智能体”论文。它允许创建一个世界，其中的智能体拥有独特的个性、记忆和指令，从而产生迷人的新兴行为。通过 JSON 文件可以轻松设置模拟，并通过一个命令轻松运行，同时通过 web 界面实时观察智能体的决策过程。

? 有趣的论文和存储库

构建，管理和运行自主AI代理。 SuperAGI是一个用于构建和运行自主AI代理的开源框架，旨在为开发人员提供强大而快速的工具，以创建有用的自主代理，无需不断进行人为干预。
FinGPT：开源金融大语言模型。FinGPT是一种新的开源语言模型，专门设计用于金融领域，强调高质量的金融数据，具有在金融中自动咨询和算法交易等各种潜在用途。
INSTRUCT EVAL: 指向面向全面评估指向性调整大型语言模型的方向。INSTRUCT EVAL 是一套用于评估大型语言模型的新评估套件，可评估问题解决能力、写作技能和与人类价值观的一致性，提高实际可用性和模型性能可扩展性。该研究可在arXiv存储库中找到。
关于大型语言水印的可靠性。一项研究表明，即使存在人类改写和未经水印处理的语言模型，水印仍可以有效地检测机器生成的文本，并且即使使用GPT-3.5和专门建造的模型，检测准确率仍然很高。研究结果显示了水印在识别和打击垃圾邮件、社交媒体机器人和互联网上的无价值内容方面的潜力。
MIND2W EB：朝着Web通用代理的方向。MIND2W EB是一个开源数据集，包含来自31个领域中137个真实网站的2000多项开放式任务，旨在开发能够遵循语言指令并在任何网站上完成任务的代理。该数据集还通过使用小语言模型过滤HTML来解决使用LLMs创建Web代理面临的挑战，帮助类GPT模型在没有预定义API或检索工具的情况下获取信息并在HTML网站上执行操作。

谢谢阅读！如果您想了解更多关于 NLP 的内容，请记得关注 NLPlanet。您可以在 LinkedIn、Twitter、Medium 和我们的 Discord 服务器上找到我们！