主要内容
谷歌在单个 GPU 上交付新的“开放”AI 模型并取得更好性能后,现已为其产品的 AI 模型推出更新,采用 Gemini 2.5,将“显著增强的基础模型与改进的后期训练”相结合,以实现更好的整体性能。谷歌称首个版本 Gemini 2.5 Pro 实验版在衡量理解、数学、编码等能力的常见 AI 基准测试中领先于 OpenAI、Anthropic、xAI 和 DeepSeek。新模型可在谷歌 AI Studio 中访问,或在应用程序的模型下拉菜单中供 Gemini Advanced 订阅者使用。该公司还宣扬 Gemini 的原生多模态性是一个优势,因其不仅能解读文本,还能解读音频、静态图像、视频和代码,并表示 200 万令牌的上下文窗口“即将推出”,以帮助处理更多数据。谷歌 DeepMind 首席执行官 Demis Hassabis 在 X 上的一篇帖子中称 Gemini 2.5 Pro 是“一个了不起的最先进模型,在 LMArena 上以高达+39 ELO 点的优势排名第一,在多模态推理、编码和 STEM 等方面全面显著改进”。谷歌表示,由于 Gemini 模型现在是“推理”模型,能逐步处理任务并做出更明智的决策,从而为复杂提示提供更好的答案和响应,质量得以提升。现在,博客文章写道:“……我们正将这些思考能力直接构建到我们所有的模型中,以便它们能处理更复杂的问题并支持更有能力、更具上下文感知的智能体。”一个演示视频展示了 2.5 Pro 利用这些推理能力根据一个提示编程视频游戏。