Google 在和 Apple 和 OpenAI 的游乐场所带来的 3 个最重要的东西。
谷歌双子星是谷歌进军大型语言模型领域的力作,这是一款旨在生成人类化文本的人工智能强大工具。该工具非常神奇,可以将用户查询转换成详细的回答。可以把它想象成你的个人人工智能助手,随时准备深入回答你的问题。
但是,像所有的AI工具一样,Gemini并不完美。它有限制,比如偶尔的误解或者回答缺乏深度。但是不用担心,谷歌正在努力完善Gemini以减少这些问题并提供更好的服务。
与OpenAI的另一款著名的AI模型ChatGPT相比,Google Gemini具有独特的特点。它与Google庞大的数据资源的整合意味着它可以提供更全面和上下文感知的响应。然而,两个模型都有独特的优势,并为不断发展的AI领域做出贡献。
展望未来,预计谷歌千禧将进化,变得更加复杂和有用。它可能会针对更具体的用例进行定制,或与其他谷歌服务集成,实现无缝的用户体验。我们迫不及待地想看看谷歌将把千禧带到哪里!
随着人工智能革命的持续,诸如Google Gemini之类的工具推动着可能性的界限。因此,让我们扣好安全带,享受这段令人兴奋的人工智能新时代的旅程吧!
谷歌本周做了什么?
在最近的一项令人兴奋的进展中,大型语言模型Bard已经吸引了技术界的注意,改变了我们对计算机未来的看法。Bard最初推出时是一个有限访问实验,它是一个轻量级的大型语言模型,旨在收集反馈和迭代。
自推出以来,巴德背后的团队一直不懈努力,迅速改进并及时推出它们。最新版本Palm 2在巴德的数学逻辑和推理能力上迈出了重要的一步。
程序员的新天堂
巴德现在可以为程序员提供更好的帮助。巴德可以帮助生成代码、修复错误以及解释代码片段。巴德熟悉C++、Go、JavaScript、Python、Kotlin和Google Sheets函数。这是一个积极的迹象,因为巴德在编码领域变得越来越流行。
Bard 的一个激动人心的功能是它能够生成和格式化代码,使开发人员更容易阅读和理解。例如,您可以让 Bard 为 Python 中的棋步生成脚本,Bard 将创建脚本并将其精美地格式化。
另一个开发人员喜欢的特色是Bard提供的代码引用功能。该功能正在改进,以使代码引用更加精确。如果Bard带入一段代码块,开发人员可以点击注释,Bard将会划线和链接到源文件,使得代码更容易理解。
Bard 还可以提供对现有代码的改进。它可以提出不同的代码改进,例如使用列表推导式、创建函数或使用生成器。然后,它可以将这些改进合并到一个 Python 代码块中,从而节省开发人员的时间和精力。
开发人员也可以直接将这个改进后的代码移入他们的工作流程中,例如使用Bard的导出功能进行协作。该功能将很快扩展到与Replit等合作伙伴的导出和运行代码,从Python开始。
生成式人工智能的最新进展
作为Bard不断改进的一部分,新增了一个暗色主题。它可以在Bard中激活或设置跟随您的操作系统设置。除此之外,还推出了两个新的导出操作,让将Bard的响应移动到Gmail和Docs更加容易。在撰写电子邮件和文档时,这个功能可以特别有用,因为它可以在Bard的帮助下为您提供先手。
但这并非全部。Bard将在其回应和提示中更加注重视觉效果。Bard很快就可以使用Google搜索和知识图谱来查找最相关的查询图像。例如,如果您询问新奥尔良必看的景点,Bard将提供相关的图像。
Bard 还可以协助处理更为重要的任务,例如大学申请。如果您不确定该学习什么,您可以向Bard提及您的兴趣,它会为您推荐相关的课程。接着,您可以请求Bard在某个特定地点下寻找提供这些课程的大学,Bard会提供一个学校列表。
你甚至可以要求Bard在谷歌地图上展示这些学校或者把信息组织在一个表格上。表格可以通过添加列来自定义,例如,显示学校是公立的还是私立的。然后,这个表格就可以移动到谷歌表格中,让别人帮助搜索。
Bard 的能力不止于此。它可以通过像 Instacart,indeed,Khan Academy 等合作伙伴的扩展,连接到全网各种服务。即将与 Adobe Firefly 合作,将允许用户在 Bard 中从想象中生成全新的图像。这将为用户打开许多让他们更快更深入地发挥创造力的方式。
回顾Bard迄今为止的旅程,这是一个快速提升和学习新技能的旋风。Bard已经从有限的试验性项目发展成对180多个国家和地区开放。
除了在更多地方提供服务外,Bard也提供更多语言支持。除了英语外,用户现在可以使用日语和韩语与Bard互动,并支持40种语言。
无论你是寻求编码帮助的开发者、申请大学的学生还是想创建独特图片的创意人士,巴德都会帮助你实现和创造你所能想象的任何东西。
双子星的介绍
生成式人工智能技术被整合到谷歌搜索的实验性特征中,称为搜索生成体验(SGE)。这个特征旨在通过让用户更快地了解一个主题,发现新的观点和见解,并更轻松地完成任务,减少用户的工作量。
SGE允许用户提出需要多次搜索的复杂问题和微妙问题。例如,“对于一个有三岁以下儿童和一只狗的家庭来说,布莱斯峡谷和拱门哪个更好?”这样的问题可以直接由SGE解答。
系统会生成一个由AI提供支持的主要信息快照,并提供深入了解的链接。它还会建议可能的下一步行动,例如后续问题,并启用一种新的对话模式,让用户可以继续向Google询问有关他们正在探索的主题的更多信息。
SGE也可提供购物帮助。当用户搜索产品时,SGE提供值得考虑的重要因素快照、符合条件的产品以及包含相关、最新评论、评级、价格和产品图片的产品描述。
此功能基于谷歌购物图谱构建,该图谱管理着超过350亿的商品清单,并每小时刷新超过18亿的清单,以提供新鲜可靠的结果。以下是新SGE功能的一些主要亮点:
- 帮助解决复杂问题:例如,如果您问类似“对于有三岁以下孩子和一只狗的家庭来说,布莱斯峡谷和拱门哪个更好”的问题,SGE可以帮助您分解这个复杂问题并提供需要考虑的关键信息概述,以及深入了解的链接。它会建议下一步行动,并允许您提出跟进问题,将一个问题的上下文延续到另一个问题,以便更自然地进行探索过程。
- 协助购物: 在寻找产品时,你会得到一个关键因素和符合要求的产品的快照。它将提供产品描述及相关的最新评论、评级、价格和图片。这个体验建立在谷歌的购物图表上,其中包含数十亿的产品清单,每小时刷新一次,以确保新鲜、可靠的结果。
- 旅游与本地搜索:SGE已经被改进以帮助本地和旅游搜索。例如,假设您对某个地点或目的地提出了详细问题。那么,您将看到一个由人工智能驱动的快照,汇集了来自网络和提交给谷歌的评论、照片和商业简介细节中最有用的信息。这个功能可以提供有用的见解,以指导您的旅行计划。
- 产品研究:如果您需要购买需要进行广泛研究的产品,搜索中的生成式人工智能可以特别有用。例如,如果您正在寻找适合海滩度假的蓝牙音箱,SGE可以提供有关蓝牙音箱引人注目的因素的快照,以及符合您标准的见解和产品。
生成型人工智能还可以帮助用户规划旅行和本地搜索。当询问有关某个地方或目的地的详细问题时,SGE提供了一个由人工智能驱动的快照,汇集了来自整个网络以及提交给谷歌的评论、照片和企业资料详情中最有用的信息。
例如,用户可能会问某个餐厅是否适合大团体用餐,是否适合素食主义者,或者何时最好游览某个特定的景点以避开人群。在SGE中,改进的体验提供了有用的洞察力,以指导用户沿途前行。
为了试用这些功能,用户可以在Google应用程序(Android和iOS)或Chrome桌面新标签页上以英语在美国注册搜索实验室。
请注意,这是一个实验性的功能,Google已经承认生成式人工智能和大语言模型(LLM)存在已知限制。他们已经采取了一些防范措施,例如限制这些能力出现的查询类型,并致力于随着时间的推移不断改进。
双子座将对OpenAI和苹果采取什么行动?
在谷歌 I/O 最近的演讲中,科技巨头向我们介绍了他们最新的 AI 进展,即他们的新生成模型:Google Gemini。这一举措使谷歌在其 AI 旅程中处于令人兴奋的十字路口,尤其是与其他 AI 产品(如 OpenAI 的 ChatGPT)相比。
在整个主题演讲中,谷歌展示了如何应用人工智能来增强Gmail、地图和Google照片等产品。例如,Gmail的新功能“帮我写”利用生成式人工智能的力量,根据用户的输入撰写复杂的电子邮件。
该功能甚至会从以前的邮件中提取详细信息来构建一致的回复。对于Gmail用户来说,这个功能是一个福利,预计会不断进化,提供更精细的建议。
同样,Google地图现在包括“路线沉浸视图”,创建高保真用户旅程表示。这是向虚拟和物理世界融合迈出的大胆一步,旨在使导航更直观、视觉上更吸引人。
此外,Google照片现在还有一个“神奇编辑器”功能,使用户能够动态地编辑照片,使他们对自己的图像拥有前所未有的控制。
然而,尽管这些功能非常具有前景,但也有其局限性。例如,由AI生成的反应可能无法完全把握人类情感的微妙差别或某些情境的背景信息。此外,对于数据隐私和由AI生成的建议准确性的担忧仍然存在。
Google还宣布了它的新基础模型PaLM 5。这些模型分别被亲切地命名为Gecko、Otter、Bison和Unicorn,它们的大小和能力各不相同。它们在逻辑、推理和100种语言的多语言文本方面接受了训练,展示了它们在各种应用中的潜力。
PaLM 5尽管令人印象深刻,但在某些方面仍落后于OpenAI的ChatGPT,如即兴和自由对话。尽管如此,其能够微调特定领域的安全和医学知识,突显了谷歌专注于创建专业、功能强大的人工智能的重点。
展望未来,谷歌提到其下一代基础模型Gemini仍在训练中。该模型从头开始建立,旨在成为一种多模态、高效率的工具,预计将比以前的模型表现更出色。然而,它与OpenAI的GPT-4相比如何仍有待观察,后者已经展示了先进的多模态能力。
Google也强调了AI责任的重要性,包括对合成内容进行水印和元数据标识。这是朝着道德AI使用的积极步骤,与OpenAI致力于负责任地使用和部署AI相呼应。
结论
总之,谷歌在人工智能技术方面的进展,如谷歌 Gemini,有可能彻底改变我们与数字产品的互动方式。尽管存在限制和挑战,未来似乎很有前途。随着人工智能技术的不断进化和变得更加复杂,像谷歌 Gemini 和 OpenAI 的 ChatGPT 这样的人工智能模型之间的竞争预计将加剧,推动人工智能可以实现的界限。苹果公司也在人工智能领域发起竞赛,投资数百万美元进行人工智能研发。另一方面,它的新 Vision PRO 已经推出。在这里阅读有关其信息。