不甘于工具,谷歌、微软重注AI Agent

内容摘要21世纪经济报道记者董静怡 上海报道 在2025年谷歌I/O开发者大会上,AI几乎贯穿整场发布会。自去年谷歌宣布进入“Gemini时代”后,AI就成了发布会的绝对主角,“更智能”、“更主动”是更新迭代的核心。在此次发布会上,谷歌除了发布升

21世纪经济报道记者董静怡 上海报道 在2025年谷歌I/O开发者大会上,AI几乎贯穿整场发布会。自去年谷歌宣布进入“Gemini时代”后,AI就成了发布会的绝对主角,“更智能”、“更主动”是更新迭代的核心。

在此次发布会上,谷歌除了发布升级版的Gemini 2.5模型,也全面重构了其产品体系,将Gemini AI嵌入所有核心业务,从搜索到生产力工具,从智能助手到XR(扩展现实)设备。

Gemini不再被视为单一的语言模型,而是将其定位为整个AI生态的核心架构,用户和开发者面对着全新的AI交互模式。

与此同时,谷歌也在推动AI从被动工具向主动代理(Agent)转变,行业普遍认为2025年将会是AI智能体爆发的一年。就在一天前,微软在Build大会上广泛布局Agent生态,进一步印证了这一趋势的行业共识。

站在AI时代的十字路口,科技巨头也面临着前所未有的挑战与机遇。

Gemini重构一切

谷歌对AI时代全面拥抱。据初步统计,在2小时的发布会里,Gemini被提及95次,AI被提及92次。这两个关键词几乎构成了整场发布会的叙事主线。

谷歌在发布会上公布的数据显示,去年同期,谷歌通过不同产品和API每月处理9.7万亿个令牌,而现在,这一数字已超过480万亿——足足增长了50多倍。

超过700万开发者正在利用Gemini进行构建,比去年同期多了五倍。同时,Vertex AI上Gemini的使用量增长了40倍。Gemini应用目前的月活跃用户已超过4亿,尤其是2.5系列模型。其中,Gemini应用中2.5 Pro的使用量更是增长了45%。

Gemini已不再是单纯的语言模型,而是谷歌AI战略的基石。本次最引人瞩目的发布之一是Gemini 2.5 Pro模型的深度优化,尤其是新增的“Deep Think”模式,在复杂推理、编程和多模态理解方面表现大幅提升。

同时,Gemini正在“接管”谷歌全家桶,谷歌将其整个生态系统迁移到Gemini架构之上,搜索业务成为首批重点改造对象。

在谷歌开发者大会上,谷歌主动颠覆自己最核心的业务传统搜索,推出了全新的AI Mode。它不再局限于传统搜索的“关键词匹配”,而是允许用户以自然语言提出长达数百字的复杂问题,并自动分解意图、生成结构化答案。

早期测试显示,用户在此模式下的查询长度是传统搜索的2—3倍,且能通过多轮对话深入探索。谷歌宣布,从5月20日开始,向所有美国用户推出AI Mode。从本周开始,Gemini 2.5也将登陆美国地区的搜索。

变革的背后,是谷歌近期面临的严峻市场挑战。市场调研机构statcounter数据显示,谷歌在全球搜索引擎市场的份额在过去六个月大部分时间都处于90%以下,这是至少十年来从未出现过的情况,其长期近乎垄断的地位正面临挑战。

Bing等竞品和第三方聊天机器人,尤其是Chatgpt,正在逐步侵蚀谷歌的传统优势。根据OpenAI的数据,截至上个月,每周有大约4亿人使用ChatGPT。

谷歌也在做AI搜索的尝试。去年,谷歌推出了AI Overviews,在传统搜索结果顶部提供AI生成的摘要,帮助用户快速获取答案,而无需点击多个链接。谷歌介绍,自去年推出以来,AI Overviews已覆盖超过15亿用户,目前已在200个国家和地区推出。

但AI Overviews只是第一步,眼下全面转向AI模式意味着更彻底的改变。正如谷歌CEO桑达尔·皮查伊所说,“这是对搜索方式的彻底重构,具备更高级的推理能力。我们正在进入AI平台变革的一个新阶段,多年来的研究如今正在成为现实。”

不过,谷歌的商业模式面临挑战。其核心收入来源一直是搜索广告,但AI Mode的推出可能会削弱传统广告的展示机会。谷歌搜索产品副总裁罗比·斯坦表示,谷歌正在探索如何在生成式AI的对话体验中加入广告。

布局Agent的未来

Agent同样是谷歌关注的重点。

传统AI助手主要扮演辅助角色,用户提问它们回答,用户下达指令它们执行。而新一代AI Agent则能够主动发起任务、独立决策,甚至与其他AI系统协同工作,自主完成复杂流程,大幅减少人工干预的必要性。

根据MarketsandMarkets预测,全球AI Agent市场将从2024年的51亿美元增长到2030年的471亿美元,年复合增长率达44.8%。

“我们认为智能体是结合了高级AI模型智能和工具访问权限的系统,因此它们可以在您的控制下代表您执行操作。”皮查伊说。谷歌此次重点展示了多个Agent项目,如Project Astra和Project Mariner。

Project Astra作为多模态AI助手,能通过摄像头和麦克风实时理解物理环境,并具备长期记忆能力。例如,在演示中,Astra能记住用户喝过的咖啡店名称,并调取相关信息。

Project Mariner基于Gemini 2.0模型构建,进一步强化了多任务处理能力,可同时管理多达10项任务,例如自动筛选房产信息、预约看房、比价购物等。

谷歌表示,开始将智能体功能引入Chrome、搜索和Gemini应用中。Gemini应用中Agent Mode的实验版本将很快向订阅者推出。

皮查伊评价称:“这是一个新兴的时代。将研究成果转化为现实的最佳方式就是让它真正发挥作用。”

值得注意的是,这一趋势并非谷歌独有,在一天前的微软Build开发者大会上,“Agent”这个词也几乎贯穿了整个议程,成为微软展示其最新创新的核心主题。

“过去一年,我们见证了智能体的使用量呈爆炸式增长。”微软首席技术官兼人工智能执行副总裁凯文·斯科特在Build大会上表示。他提到,微软所关注的各种智能体的日活跃用户数量,自去年Build大会以来已经“增长了一倍以上”。

在微软的开发者大会上,GitHub Copilot的进化最具代表性,实现了从“代码补全工具”向“AI编程伙伴”的质变。微软CEO萨蒂亚·纳德拉在大会上演示,新版GitHub Copilot不再局限于实时辅助编程,而是可以直接帮开发者修Bug、重构代码、提升测试覆盖率甚至实现新功能。

而微软做Agent的野心更在于打造智能体开发和应用平台。一方面通过Azure AI Foundry为开发者提供构建、定制和管理AI应用程序和代理的平台,支持超过1900种AI模型;另一方面推出Windows AI Foundry,为本地AI开发提供从模型选择、优化、微调到部署的全生命周期支持。

科技大厂密集布局有意抢占先机,毕竟AI Agent领域刚刚起步,格局未明,标准也还在制定当中。从技术演进的角度看,Agent被视为“下一个爆发点”,行业普遍认为2025年将会是AI智能体爆发的一年。

不过,尽管科技大厂们在发布会上展示了Agent的潜力,大规模部署仍面临挑战。AI Agent需要极高的计算资源,运行成本仍然高昂。此外,AI Agent的可靠性、安全性和伦理问题仍需解决。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1