每周AI和NLP新闻 - 2023年6月20日
ChatGPT的价格降低了,GPT-4现在可以使用第三方功能。
以下是由NLPlanet为您精选的NLP和AI的每周文章、指南和新闻!
?来自网络的新闻
- 功能调用和API更新。OpenAI发布了几个新的更新,包括GPT-3.5-turbo的16k上下文版本,用于调用用户定义函数的新API,模型和输入标记的成本降低以及GPT-4和GPT-3.5-turbo的更新版本。这些更新旨在改善GPT的功能,使其更容易与外部工具和API连接起来。
- 第一个基于Yann LeCun视觉的面向更加人类般AI的AI模型。 I-JEPA模型采用自我监督学习,捕捉关于世界的常识知识,并避免生成方法的局限性。 Yann LeCun关于人类般AI的愿景是该模型的基础。
- Google Lens现在可以搜索皮肤情况。Google Lens现在具有一种功能,即通过分析上传的图像来识别皮肤情况和其他身体不适。该功能可以与聊天机器人集成,为照片中的对象提供准确的答案。
- 欧洲在人工智能法规方面取得进展,挑战科技巨头的权力。欧洲议会已批准了欧盟人工智能法案,以调节人工智能,保护消费者免受诸如歧视和错误信息等风险。该法案禁止某些工具,并设定高风险技术的限制,通过透明和基于风险的方法促进负责任的人工智能开发。它还可能影响国际政策,并敦促公司朝着统一的监管格局发展。
- 保持 HTML 结构,将以下英文文本翻译成简体中文:保罗·麦卡特尼(Paul McCartney)借助人工智能录制了一首甲壳虫乐队的歌曲。保罗·麦卡特尼使用 AI 技术恢复了约翰·列侬的声音,并从一盒标有“给保罗”的 1978 年的卡带中录制了一首甲壳虫乐队的歌曲。这次合作展示了人工智能在音乐保护方面的潜力,并为未来的艺术家和粉丝打开了新的机遇。
- 人们正在通过抓取公开的 API 密钥来盗版 GPT-4。OpenAI 警告称,被窃取的 API 密钥正在被广告用于未经授权的访问 GPT-4,这可能导致账户持有人面临意外费用。建议用户保护好他们的密钥,如果密钥暴露了,立即更换。自动扫描将被用于吊销已确定的暴露的密钥。
? 来自网络的指南
- LLM中的100K上下文窗口背后的秘密酱汁:所有技巧都在一个地方。研究人员已经开发出了优化技术,以使大型语言模型能够训练更长的上下文长度,包括用ALiBi替换位置正弦编码、使用稀疏注意力、采用FlashAttention、实现多查询注意力以及使用条件计算来优化速度和准确性。这些技巧使训练范围扩展到100K令牌,从而更容易生成更长的文本。
- 利用猎鹰40B 型号,最强大的开源LLM。 猎鹰40B 是一个强大的开源LLM,在AI社区中引起了轰动。 使用Hugging Face的本指南可以帮助爱好者和专业人士开始探索其潜力而不受阻碍。
- 如何运作GPT:药水寓言,形容关键词、值、查询及关注的关系。本文解析了GPT模型如何应用关键词、值以及查询在关注中理解文本中单词的背景。作者使用了制药的比喻来描述这些元素如何协同工作。理解这种互动有助于预测下一个单词和上下文的连贯性。
- 如何我和我的网友使用人工智能。本文讨论了AI在提升生产力和创造力方面的真实应用,例如ChatGPT和DALL-E 2。AI非常适用于生成想法和视觉效果,但应与个人的精髓相结合,共同创造出卓越的内容。
- GPTeam: 一种多智能体模拟。GPTeam 是一种开源的多智能体模拟,灵感来自于斯坦福的“生成智能体”论文。它允许创建一个世界,其中的智能体拥有独特的个性、记忆和指令,从而产生迷人的新兴行为。通过 JSON 文件可以轻松设置模拟,并通过一个命令轻松运行,同时通过 web 界面实时观察智能体的决策过程。
? 有趣的论文和存储库
- 构建,管理和运行自主AI代理。 SuperAGI是一个用于构建和运行自主AI代理的开源框架,旨在为开发人员提供强大而快速的工具,以创建有用的自主代理,无需不断进行人为干预。
- FinGPT:开源金融大语言模型。FinGPT是一种新的开源语言模型,专门设计用于金融领域,强调高质量的金融数据,具有在金融中自动咨询和算法交易等各种潜在用途。
- INSTRUCT EVAL: 指向面向全面评估指向性调整大型语言模型的方向。INSTRUCT EVAL 是一套用于评估大型语言模型的新评估套件,可评估问题解决能力、写作技能和与人类价值观的一致性,提高实际可用性和模型性能可扩展性。该研究可在arXiv存储库中找到。
- 关于大型语言水印的可靠性。一项研究表明,即使存在人类改写和未经水印处理的语言模型,水印仍可以有效地检测机器生成的文本,并且即使使用GPT-3.5和专门建造的模型,检测准确率仍然很高。研究结果显示了水印在识别和打击垃圾邮件、社交媒体机器人和互联网上的无价值内容方面的潜力。
- MIND2W EB:朝着Web通用代理的方向。MIND2W EB是一个开源数据集,包含来自31个领域中137个真实网站的2000多项开放式任务,旨在开发能够遵循语言指令并在任何网站上完成任务的代理。该数据集还通过使用小语言模型过滤HTML来解决使用LLMs创建Web代理面临的挑战,帮助类GPT模型在没有预定义API或检索工具的情况下获取信息并在HTML网站上执行操作。
谢谢阅读!如果您想了解更多关于 NLP 的内容,请记得关注 NLPlanet。您可以在 LinkedIn、Twitter、Medium 和我们的 Discord 服务器上找到我们!