返回列表

Google 推出 Deep Research 和 Deep Research Max 智能体,用于自动化复杂研究

2026/04/22 Verified Content
Google 推出 Deep Research 和 Deep Research Max 智能体,用于自动化复杂研究

Google 推出 Deep Research 和 Deep Research Max 智能体,用于自动化复杂研究

Google 推出了两款基于其 Gemini 3.1 Pro 模型构建的全新自主研究智能体:Deep Research 和 Deep Research Max。

这两款智能体现已通过 Gemini API 的付费层进入公开预览阶段,面向希望将高强度研究工作自动化的开发者。一次 API 调用即可启动完整的研究工作流,而且这些智能体首次可以同时接入开放网络和专有数据流,提供带完整来源的分析结果。

面向不同工作负载的两种版本

标准版 Deep Research 智能体取代了 Google 于 12 月发布的预览版,主打在更低延迟和更低成本下提供更高质量。它面向速度最重要的场景,例如用户期待即时响应的聊天界面。

Deep Research Max 则走向另一端,更优先考虑深度而非速度。该智能体会使用更长的测试时计算来进行推理、搜索,并反复打磨最终报告。Google 表示,它尤其适合异步后台工作流,例如夜间运行的 cron job,在第二天早晨把完整的尽职调查报告送到分析师团队桌上。

在 Google 自己的基准测试中,Deep Research Max 在检索和推理任务上的表现有明显提升。Google 称,该智能体比上一版本会调用更多来源,也能捕捉到旧模型往往会忽略的细微差别。

不过,把它与 OpenAI 的 GPT-5.4 和 Anthropic 的 Opus 4.6 直接比较,并不完全公平。GPT-5.4 很擅长自主网页搜索,但它并不是专门为深度研究调优的。针对这类任务,OpenAI 提供的是自家的 DR 智能体,而该产品在 2 月更新后已切换到 GPT-5.2,而不是 GPT-5.4。OpenAI 最强的搜索模型实际上是 GPT-5.4 Pro,而 Google 显然没有把它纳入比较。按照 OpenAI 的说法,GPT-5.4 Pro 在智能体搜索基准 BrowseComp 上最高可达 89.3%,而 GPT-5.4 为 82.7%。

Anthropic 对 Opus 4.6 报告的 BrowseComp 成绩也高于 Google 展示的数据,具体为 84%。Anthropic 表示,这一分数是在关闭推理的情况下取得的,因为与 Google 在其 API 基准中采用的高强度推理相比,模型在关闭推理时反而表现更好。

这些差异很可能来自测试方法,例如模型是通过原始 API 测试,还是包裹在各家自己的工具链中进行评估。Google 的数据不一定有误,但仍值得谨慎看待。无论如何,这种展示方式并不透明。

MCP 支持让该智能体接入专有数据

一个较大的变化是支持 Model Context Protocol(MCP)。开发者可以把 Deep Research 接入自己的数据源和专用信息流,例如金融或市场数据提供商。Google 表示,通过接受任意工具定义,这款智能体将从纯网页搜索工具转变为能够查询专业数据库的完整自主智能体。

这也是 Gemini API 首次支持该智能体直接在报告中生成原生图表和信息图,可渲染为 HTML 或“Nano Banana”格式,从而更方便地以可视化方式呈现复杂数据。

其他新增功能还包括协作式规划,允许用户在运行前查看并调整智能体的搜索计划;支持来自 PDF、CSV、图像、音频和视频的多模态输入;以及对中间步骤的实时流式输出。开发者还可以完全关闭网页访问,将智能体限制在自有数据范围内。

Google 表示,这些智能体运行在与其面向消费者产品中的研究功能相同的基础设施之上,包括 Gemini 应用、NotebookLM、Google Search 和 Google Finance。开发者现在可以通过 Interactions API 构建自定义搜索工作流,而这两款智能体也将很快通过 Google Cloud 向初创企业和企业客户推出。

不要错过的重要内容

关注 AI 动态。清晰、有用、不夸张。

AI 社区与洞察

关注 The Decoder,获取 AI 新闻、背景报道和专家分析。

Newsletter - THE DECODER

关注 AI 动态。清晰、有用、不夸张。

Join the discussion

正在确认登录状态...
暂时还没有评论,快来抢沙发~