

新智元报谈
剪辑:定慧
【新智元导读】OpenAI刚用Deep Research抢了先手,平直掀桌!DeepMind祭出相干智能体双杀,Max版质料评分从66.1%暴拉到93.3%,学问使命自动化的武备竞赛珍重插足贴身肉搏。
在AI智能体上,谷歌此次又放出了个大招。
4月末,谷歌DeepMind连气儿甩出两款AI相干智能体。
Deep Research(方法版):追求速率和低延迟,符合及时交互
Deep Research Max(增强版):追求最大珍重度,用推广test-timecompute异步跑后台大任务
两个智能体都基于刚发布的Gemini 3.1 Pro。

谷歌CEO Pichai也亲身下场站台。

Max版在三个巨擘基准测试中都拿到了SOTA得分:
DeepSearchQA:93.3%,轮廓网页相干才气
BrowseComp:85.9%,在网页上定位难谋事实
Humanity's Last Exam(HLE):54.6%,东谈主类最难学科众人级题库

这两个智能体干的事情很直白:你给一个相干课题,它我方去网上扒贵寓、分析数据、生成带图表的齐全论说。
方法版处治平方相干任务,Max版专攻重度场景:遵法侦查、竞品分析、市集研报,那种往时要一个分析师团队干两天的活。
Max版在DeepSearchQA基准上达到93.3%。
什么意见?
昨年12月并吞项测试,得益是66.1%。
四个月,涨了27个百分点!
Humanity's Last Exam上也从46.4%拉到54.6%,平直刷新记录。
灵验户暗意平方版块的方法版即可代替平方的文献研读。

学问使命的自动驾驶期间
一个值得玩味的趋势正在成型:AI相干器具正在从「赞成搜索」进化成「自主相干」。
往时的AI搜索是你问一句、它答一段。
当今的相干智能体是你丢一个课题,开云官方app下载它我方跑几十轮搜索-分析-考证轮回,终末交一份制品论说。
分辨就像导航软件和自动驾驶的距离。
谷歌、OpenAI、Anthropic三家同期押注这个标的。
Anthropic的Claude在代码智能体上猛攻,OpenAI用Deep Research霸占相干场景,谷歌当今带着93.3%的得益单杀记忆。
Pichai亲身在发布会上强调93.3%这个数字。他说这是通过增多贪图资源达到的。
意味着,只需花更多的电,就能获取更准的谜底。
贪图资源成了新的入场券。小公司买不起。孤苦看守人付不起。独一大企业才付得起。
这不是器具升级。这是贸易样式的代际替换。
从「纲领机器」升级成企业使命流底座
昨年12月,谷歌通过Interactions API向种植者洞开了Gemini Deep Research智能体,OD体育app官网让种植者能用上谷歌最前沿的自主相干才气。
今天,谷歌把它推到下一个台阶。
Deep Research和Deep Research Max两款智能体都由谷歌最强的模子Gemini 3.1 Pro驱动。

Deep Research仍是不再是一个耀眼的「纲领机器」了。
它当今是金融、生命科学、市集调研等企业级使命流的底层基础方法。
它的论说自身有孤苦价值,但更垂危的是——它是更复杂的AI智能体使命流的第一步:深度高下文蚁集。
一次API调用,种植者就能触发一次透顶的相干使命流——史上第一次,把公开网页数据和你我方的专稀有据流交融在沿途,输出一份专科级的、带齐全援用的分析论说。
两款智能体,匹配不同场景
谷歌联想了两款智能体,对应从平直面向用户到大范围离线处治的不同需求。
Deep Research(方法版)为速率和效果而生。
它取代了昨年12月的预览版块,权贵裁汰了延迟和本钱,同期把质料拉得更高。
适用场景:需要低延迟的交互式用户界面。

Deep Research Max(增强版)为最大珍重度和最高质料而生。
Max讹诈推广的test-timecompute(测试时贪图),反复推理、检索、精湛最终论说。

买通独到数据+原生图表
Deep Research当今不错检索:
公开网页
任性而已MCP管事器
用户上传的文献
邻接的文献存储
或以上任性子集的组合。
这套才气是成心为专科东谈主士每天濒临的复杂受限数据天地联想的。

MCP契约复旧(最要道的一项)
你不错通过MCP契约,把Deep Research安全地邻接到你自界说的数据和专科数据流——比如金融数据供应商、市集数据供应商。
Deep Research复旧任性器具界说。
这让它从一个网页检索器升级成了能在职意专科数据仓库里自主导航的智能智能体。
往时分析师吃饭的家伙(彭博、FactSet、S&PGlobal结尾),当今AI不错平直接入、自主查询、轮廓分析。
原生图表与信息图
Gemini API里的Deep Research第一次——不再只生成翰墨,收复生生成高质料的图表和信息图。

底层达成用HTML或Nano Banana。
动态可视化复杂数据集,平直镶嵌分析论说中。
往时一个分析师用Tableau/PowerPoint作念2小时的图表,Deep Research Max平直在论说里原生生成。
毋庸切换器具,毋庸再折腾对王人。
重磅互助伙伴
为了让这项技能在低容错率的专科鸿沟真确落地,谷歌正在和金融、生命科学等行业的初创公司和企业密切互助。
比如——
谷歌正在与以下三家公司互助联想MCP管事器:
FactSet(华尔街分析师标配结尾)
S&PGlobal(标普天下评级与数据)
PitchBook(私募股权与风险投资数据库)
让分享客户不错把金融数据接入Deep Research驱动的使命流,以闪电般的速率调取这些公司各自的海量数据天地,达成坐褥力的阶跃式进步。
延迟解读:FactSet+S&P+PitchBook=天下投行、PE、究诘公司相干素材的三大上游供应商。它们主动把我方的数据接入谷歌的AI——意味着分析师往时赖以活命的数据订阅护城河透顶隐匿。
往时你因为能用上这些数据而值钱,当今职何一个企业订阅了Deep Research都能用上。
如何使用
即日起,Deep Research和Deep Research Max在GeminiAPI付费层开启公开预览。
种植者不错侦查谷歌官方种植者文档,通过Interactions API运行构建。
Deep Research和Deep Research Max很快也理会过谷歌Cloud洞开给初创公司和企业。
谷歌作念好了一个能替代分析师的AI,当今统统企业都不错用API调用它。
参考贵寓:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/next-generation-gemini-deep-research/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=
HJC黄金城官方首页入口