AGI实验室公布首项成果：先进人工智能智能体

2025-03-31

新闻要点

亚马逊位于旧金山的AGI SF Lab 推出新AI模型Amazon Nova Act，在多项基准测试中超越OpenAI和Anthropic的模型。该模型旨在打造可靠AI 代理，亚马逊还通过强化学习等提升其能力，这或让亚马逊在创建实用软件代理竞赛中成为黑马。

- Amazon Nova Act在多基准测试中超越竞品模型

- 亚马逊用强化学习提升Nova Act决策能力

- 亚马逊借机器人应用助力新模型开发

主要内容

亚马逊在开发先进人工智能的竞赛中仍被视为有点落后，但它已悄然创建了一个实验室，如今在人工智能性能方面创下了纪录。亚马逊的 AGI SF 实验室位于旧金山，致力于构建通用人工智能，即超越人类能力的人工智能。今天，该实验室展示了其工作的首批成果：一种能够为任何地方可用的一些最先进人工智能代理提供动力的新人工智能模型。

亚马逊称，新模型名为亚马逊 Nova Act，在旨在衡量人工智能代理智能和能力的几个基准测试中，其性能优于 OpenAI 和 Anthropic 的模型。在基准测试 GroundUI Web 和 ScreenSpot 中，亚马逊 Nova Act 的表现优于 Claude 3.7 Sonnet 和 OpenAI 计算机使用代理。

亚马逊在人工智能市场竞争计划的一个主要部分是专注于构建代理，新模型的能力反映了其努力构建一代能够与现有最佳工具相媲美的工具。“我相信未来计算的基本原子单位将是对一个巨大[人工智能]代理的调用，”领导亚马逊 AGI SF 实验室的 David Luan 说。他曾是 OpenAI 的工程副总裁，后来共同创立了 Adept，这是一家在人工智能代理方面开创性工作的初创公司，2024 年加入亚马逊，当时这家电子商务巨头持有该公司的股份。

目前，大多数领先的人工智能实验室都专注于构建越来越强大的人工智能代理。让人工智能掌握独立行动以及对话，有望使该技术更有用和有价值。然而，从聊天到行动的转变仍在进行中。在过去的六个月里，OpenAI、Anthropic、谷歌等都展示了能够根据提示采取行动的网络浏览代理。但在大多数情况下，这些代理仍然不可靠，很容易被开放式请求绊倒。

Luan 表示，亚马逊的目标是构建可靠而非华而不实的人工智能代理。阻碍代理发展的不是需要“更多在 60%时间内有效的有趣能力的酷炫演示，而是 Waymo 问题”，他说，指的是自动驾驶汽车需要在不受监督的情况下上路之前接受训练以应对不寻常的边缘情况。

许多所谓的代理是通过将大型语言模型与旨在防止它们偏离轨道的多个人工编写规则相结合而构建的，但这也使其行为变得脆弱。亚马逊 Nova Act 是该公司最强大的本土模型亚马逊 Nova 的一个版本，经过了额外的训练，以帮助它决定采取何种行动以及何时采取行动。

总的来说，Luan 说，人工智能模型很难决定何时应该干预一项任务。为了提高 Nova 的代理能力，亚马逊正在使用强化学习，这是一种帮助其他人工智能模型更好地模拟推理的方法。亚马逊还从其新模型中获得了物理机器人的灵感。Luan 的团队正在与亚马逊在旧金山的另一个团队合作，该团队由加州大学伯克利分校的教授 Pieter Abbeel 领导，他致力于为机器人寻找人工智能应用。Abbeel 是 OpenAI 的早期员工之一，在亚马逊 2024 年投资他的初创公司 Covariant 后于 8 月加入亚马逊。

鉴于其履行中心已经部署了大量机器人，亚马逊在机器人技术方面处于有利地位。亚马逊 Nova Act 的发布表明，亚马逊可能会在创建有用的软件代理的竞赛中成为一匹黑马。该公司在应对 ChatGPT 方面反应迟缓，但最近已显示出正在采取行动的迹象。今年 2 月，该公司宣布了其语音助手 Alexa 的新版本，具有改进的对话能力以及自动化某些网络任务的能力。亚马逊引用的一个用例是 Alexa 帮助预订损坏烤箱的维修服务。Luan 表示，Alexa 的新代理功能将使其更加智能和实用。

AGI实验室公布首项成果：先进人工智能智能体

新闻要点

主要内容

关于我们