每周人工智能和自然语言处理新闻-2023年6月6日

缺乏GPU减缓了OpenAI的速度,律师援引ChatGPT发明的虚假案例等。

ChatGPT中文站
Image from Midjourney

以下是NLPlanet为您筛选的本周自然语言处理和人工智能文章、指南和新闻!

? 来自网络的新闻

  • OpenAI计划,由Sam Altman提出。OpenAI计划优先创建更便宜和更快速的GPT-4,扩展上下文窗口,并在2024年发布多模态。然而,他们目前受到GPU短缺的限制,并且在不久的将来无法制作数百万倍的更大模型。Fine-tuning API将扩展到最新模型。
  • JPMorgan训练AI来解释联邦储备意图。JPMorgan Chase使用基于ChatGPT的模型来准确预测美国金融监管机构有关利率变化的声明。大型语言模型可以提供准确的预测,为调整策略的投资者带来巨大的利润。
  • 英伟达展示了一个强大的使用人工智能技术的演示,让游戏角色能够与玩家进行对话,增强了游戏的真实感和玩家的体验,为游戏开发者提供了一个提高游戏故事性和整体参与度的工具。
  • 律师援引ChatGPT发明的假案件,法官并不感到幽默。 一名律师在他们的法律文件中引用了由ChatGPT生成的虚假案件,强调了验证人工智能生成内容的准确性和合法性的重要性。 虽然ChatGPT等生成AI技术可以使法律行业受益,但如果不仔细审核,可能会引起道德和法律问题。
  • 为什么英伟达突然成为世界上最有价值的公司之一。 英伟达的GPU已成为开发AI的关键组成部分,使其价值达到9393亿美元; 随着AI应用程序需要大量数据,公司正在购买数千个英伟达昂贵的芯片。 随着初创企业与大型科技公司竞争以获取其昂贵的GPU,英伟达在行业中的主导地位预计将继续存在。

? 来自网络的指南

  • 使用流程监督来改进数学推理。研究人员发现,使用流程监督能够显著提高AI模型的数学问题解决能力。通过奖励每个正确的推理步骤,该模型实现了一个新的最先进状态,超越了结果监督在性能和与人类思维的一致性方面。
  • Barkour: 用四足机器人衡量动物敏捷性的基准测试。Google创建了Barkour,一个灵感来自狗的敏捷性比赛的四足敏捷性基准测试,评估机器人相对于动物的表现。该基准测试鼓励四足机器人具有高效、可控和多功能的运动控制器,并使用一种新的策略(学生-教师框架)进行训练,以确保更大的稳健性、多功能性和动态性。
  • 使用文本转SQL和语义搜索相结合以进行检索增强生成。LlamaIndex的SQLAutoVectorQueryEngine是一种强大的工具,可以通过将SQL的表达能力与向量数据库上的语义搜索相结合来查询结构化和非结构化数据,为人工智能专业人员提供全面的解决方案。

? 有趣的论文和代码库

  • 神经安格罗。神经安格罗是一种高效灵活的框架,可通过RGB视频捕捉进行高质量的3D表面重建。其优化技术使用户能够创建物体为中心和大规模世界场景的逼真3D模型,具有高度详细的3D几何形状。
  • lyuchenyang/Macaw-LLM: Macaw-LLM: 多模态语言建模,支持图像、视频、音频和文本集成。Macaw-LLM 是一个多模态语言建模框架,通过对齐多模态数据、使用 CLIP 和 Whisper 进行编码,并将输出馈送到 LLaMA 进行高效学习,集成了图像、视频、音频和文本。它支持多种语言,并可通过添加更多模型进行扩展。
  • 可控的文本生成图像技术——GPT-4。Control-GPT是一种人工智能模型,通过使用大型语言模型生成TikZ代码草图来改进文本生成图像技术。这些草图作为扩散模型的参考,增强了空间推理能力,提高了图像生成的可控性。Control-GPT为空间排列和对象定位设定了一个新的标准,并通过赋予用户控制对象位置和大小的能力将先前模型的准确度翻倍。
  • 使用大语言模型的开放式具身代理。Voyager 是一个全新的具身终身学习代理,在没有人为干预的情况下探索和征服 Minecraft。它有一个自动课程,一个技能库,并使用代码作为行动空间,以获得更大的组合动作。它的迭代提示机制从错误中学习并不断进步。
  • 一名博士研究生对NLP研究的看法。一份新文件突出了除了LLMs以外的NLP探索未被开发的领域,并提供了14个研究领域的简要描述,这些领域充满了探索的机会。这份文件对于博士研究生和研究人员来说,是一个有价值的指南,可以为他们在NLP领域寻找令人兴奋的探索领域提供帮助。

感谢阅读!如果您想了解更多关于自然语言处理的知识,请记得关注NLPlanet。您可以在LinkedIn、Twitter、Medium以及我们的Discord服务器上找到我们!

2023-10-20 16:42:37 AI中文站翻译自原文