数十亿AI员工上岗倒计时！云计算一哥“没有魔法，只有真能解决问题的Agent”

2025年的大模型产业正在经历一场静默的分化。一边，少数明星模型的参数竞赛依然激烈；另一边，一个更根本的转变已在基础设施层悄然发生：

AI的价值实现路径，正从“模型能力展示”转向“Agent实际部署”。

亚马逊云科技CEO马特·加曼（Matt Garman）在今日凌晨举办的2025 re:Invent主题演讲中直言：“Agent的出现使我们在AI轨迹上发生了变化——从一个技术奇迹的时代，转向真正获得价值的时代。”

他的判断基于一组反差强烈的数据：一方面，生成式AI引发全球狂欢，Amazon Bedrock已服务超过10万家企业，其中50多家客户处理了超1万亿tokens；另一方面，许多企业仍未看到AI投资带来相匹配的业务回报。

数十亿AI员工上岗倒计时！云计算一哥“没有魔法，只有真能解决问题的Agent”
▲Garman在讲解Amazon Bedrock落地情况

“Agent是企业从AI投资中获得实质性商业回报的地方。”Garman揭示了一个关键转折点，“我相信，在未来每个公司内部和每个可以想象的领域都会有数十亿的Agent。”

一场重新定义AI价值实现的竞赛已经打响。在亚马逊云科技2025 re:Invent的舞台上，AI芯片性能飙涨600%，构建AI Agent的四大技术支柱同步升级，Agent部署的全栈战争已经升级……到底什么才是企业抓住这场变革红利的抓手？

云计算一哥的一招一式，都给了我们解答Agent变革时代之问的绝佳参考。

数十亿AI员工上岗倒计时！云计算一哥“没有魔法，只有真能解决问题的Agent”
▲Garman在讲解Agent部署的所需要素

一、重新定义AI Infra：自研芯片与「AI工厂」的双重革命

算力竞争已进入云巨头自主可控、性能狂飙的阶段。亚马逊云科技在2025 re:Invent上亮出了其最尖端的武器：基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器正式全面推出，而下一代Trainium 4芯片的性能参数更令人震撼。

“如果看看今天在Amazon Bedrock上运行的所有推理，大多数实际上已经由Trainium驱动了。”Garman透露。更令人印象深刻的是，亚马逊云科技已部署超过100万颗自研Trainium芯片，而上一代Trainium 2的量产速度是其此前芯片的4倍。

最新性能数据揭示了这场算力革命的紧迫程度：基于首款云端3nm AI芯片Trainium 3，亚马逊云科技最新推出的Amazon EC2 Trainium 3 UltraServers服务器，最极致的配置将144颗Trainium 3芯片互连，提供362PFLOPS（FP8）算力和超过700TB/秒的总带宽。

该服务器提供相比前代Trainium 2的4.4倍的计算性能、3.9倍的内存带宽提升，而能效比指标——每兆瓦电力处理的AI token数量——提升了5倍。

数十亿AI员工上岗倒计时！云计算一哥“没有魔法，只有真能解决问题的Agent”
▲Amazon EC2 Trainium 3 UltraServers服务器性能情况

更值得一提的是，对于下一代Trainium 4，亚马逊云科技承诺了更大幅度的飞跃：预计提供6倍的FP4性能，4倍的内存带宽，2倍的内存容量，并支持通过NVLink Fusion和UALink进行扩展，专为全球最大的模型训练需求而生。

但芯片性能只是故事的一半。亚马逊云科技同时推出了更具战略意义的Amazon AI Factories（AI工厂）服务——允许企业在自己的数据中心部署专用AI基础设施，同时享受亚马逊云科技的全套服务和管理。

这一举措直击企业生成式AI出海和全球化部署中的核心痛点：数据主权、合规要求与性能需求的平衡。企业可以在本地维护数据控制权，充分利用既有空间与电力资源；同时获得与公有云相同的先进AI能力，无缝接入从Trainium、英伟达GPU到SageMaker和Bedrock的全栈AI服务。

二、模型生态的多元主义：自研模型超GPT-5.1，中国模型占1/4席位

与追逐“万能模型”的潮流相反，亚马逊云科技选择了多元化的模型战略。“我们从不相信会有一个模型统治一切。”Garman明确表示，“相反，会出现很多伟大的模型。”

这一理念在Amazon Bedrock平台上得到充分体现。过去一年，Amazon Bedrock平台提供的模型数量翻倍，2025 re:Invent上新增的18款全托管开源模型也包含4款中国顶尖模型，中国模型占1/4席位，包括千问、DeepSeek、Kimi及MiniMax多家模型已上线Amazon Bedrock平台。

对中国企业而言，这意味着在出海和全球化过程中，可以获得更贴近本土技术特点的生成式AI支持。对全球用户而言，这代表了更广泛的技术选择。

亚马逊云科技最新推出的自研的Amazon Nova 2系列模型则展示了另一种可能。四款新型号覆盖了从轻量推理到复杂多模态的全场景需求：

Amazon Nova 2 Lite：是一款快速且经济高效的推理模型，拥有不错的指令遵循、工具调用、信息提取、代码生成等能力，在上述四大领域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模型，仅在编程能力上略逊于GPT-5 mini。

Amazon Nova 2 Pro：是Nova系列中最智能的推理模型，支持文字、图像、视频、语音四种模态输入和文本模态输出，适用于高度复杂的工作负载，尤其是Agent场景。在两项Agent基准测试中，其表现已经超过了GPT-5.1（high）、Gemini 3 Pro Preview（high）等前沿模型。

Amazon Nova 2 Sonic：下一代语音转语音模型，能为AI应用提供实时、类人的对话式AI体验。在语音理解和推理任务上，其性能已经超过了GPT Realtime、Gemini 2.5 Flash等。

Amazon Nova 2 Omni：是业界首个支持文本、图像、视频和音频输入，并支持文本和图像生成输出的推理模型。不过，亚马逊云科技尚未公布其基准测试成绩。

数十亿AI员工上岗倒计时！云计算一哥“没有魔法，只有真能解决问题的Agent”

数十亿AI员工上岗倒计时！云计算一哥“没有魔法，只有真能解决问题的Agent”

新车性能更多>>