4006-998-758
新闻动态

NeurIPS 与 re:Invent 背后,AI正在从“模型竞赛”转向“工程硬仗”

2025-12-17
NeurIPS 与 re:Invent 背后,AI正在从“模型竞赛”转向“工程硬仗”(图1)


—— 一边是论文数量与质量的巅峰对决,一边是对Agent落地ROI的极致验证。




两场大会,两种温度
2025年12月,全球AI圈的目光分成了两拨:

  • 一拨涌向圣地亚哥,参加AI界的“奥斯卡”——NeurIPS。那里,清华以390篇论文险胜Google,中国高校集团军在科研体量上完成历史性反超;
  • 另一拨涌入拉斯维加斯,聚集在亚马逊re:Invent大会。CEO Matt Garman宣布:“Agentic AI已从技术奇迹,变为实用工具”,并展示了6人76天干完原需30人18个月的项目

一边是论文数量与质量的巅峰对决,一边是Agent落地ROI的极致验证

表面看,AI正高歌猛进;
实则,一场泡沫预警正在业内悄然蔓延。

就在re:Invent现场,一位硅谷工程师苦笑着说:

“如果你和每个做Agent的展商干杯,走一半你就醉了——哪怕他们根本没做出能跑的Agent。”

而数据库公司PingCAP CTO黄东旭更直言:

“我要来泼冷水:Agent的基础设施还很薄弱。”

这盆冷水,不是泼向AI的未来,而是浇醒那些只看到“智能体”幻象、却忽视工程根基”的狂热者。


01


NeurIPS 2025:中国科研的“量变到质变”

NeurIPS 2025的数据,揭示了一个清晰趋势:中美AI双极格局已固化

  • 总量上:清华大学以390篇接收论文,微弱优势超越Google(388篇); 

  • 质量上:在Oral + Spotlight(顶级论文)中,Google以72篇反超清华(65篇),但差距仅7篇。

NeurIPS 与 re:Invent 背后,AI正在从“模型竞赛”转向“工程硬仗”(图2)

The New Map of Frontier AI Research at NeurIPS 2025

这说明什么?

清华赢在广度,Google赢在高度。

Google 的份额从全量的 2.17% 提升至 2.82% (72 篇),反超清华夺回第一。这说明在定义 SOTA 的突破性工作上,DeepMind 与 Google Brain 依然具备极强的竞争力。
清华在高质量榜单上并未掉队,份额提升至 2.54% (65 篇),稳居全球第二。 

更值得关注的是,全球 AI 研究正形成清晰的“三城记”格局: 

  • 旧金山湾区:Google、Meta、Stanford、Berkeley 构成技术-资本-人才闭环; 

  • 北京:清华、北大、国科大以高校集团军驱动基础创新; 

  • 上海:上海交大、复旦、上海 AI Lab 正快速崛起为“第三极”,三者合计在 Top 50 榜单中份额高达 7.3%,足以与湾区、北京并列。

这标志着,中国 AI 不再只是“北京一枝独秀”,而是双核驱动、三极并立的新生态正在成型。

中国已从“科研数量优势”迈向“核心突破能力”的临界点

更关键的是,技术赛道正在迁移

  • LLM红利见顶:传统大模型论文增长放缓;

  • RL & Robotics爆发:相关论文达2302篇,年增39.4%;

  • 中国增速惊人:在RL领域份额达29.9%,增速81.1%,直逼美国(32.1%);

  • NLP重心东移:中国在自然语言处理领域论文占比33.8%,首次超过美国(31.4%)。

这意味着:

AI的战场,正从“语言模型”转向“具身智能”——从屏幕里的聊天,走向物理世界的行动

正如NeurIPS新增的“立场论文”(Position Paper)所暗示:
AI已不仅是技术问题,更是社会、制度与伦理的系统工程

欧洲正押注“可解释AI”(Explainable AI),美国聚焦“超级智能”,而中国,则在工程化落地(如RL、Agent、AI for Science)上全力冲刺。


02


re:Invent 2025:Agent不是魔法,而是“数字员工”

如果说NeurIPS是“未来方向”,那么re:Invent就是“当下答案”。

亚马逊云科技CEO Matt Garman的判断斩钉截铁:

“Agentic AI正处于关键转折点——从‘技术奇迹’变为‘实用工具’。”

大会展示的案例,无不指向一个事实:Agent的价值,在于解决“旧问题”而非创造“新概念”

  • 索尼:用Agent将合规审查效率提升100倍; 

  • S&P Global:新应用部署从“几周”压缩至“几分钟”; 

  • Amazon Transform:自动迁移大型机代码,消除70%维护成本; 

  • Kiro Agent:6人76天完成原需30人18个月的项目。

这些不是Demo,而是已跑在生产环境中的“数字员工”

亚马逊的Agent三大特征,也定义了真正的Agentic AI: 

  • 1.自主决策:能理解任务目标,自主规划步骤; 

  • 2.横向扩展:可调用多工具、多API协同; 

  • 3.长时运行:支持复杂、多轮、跨会话任务。

但亚马逊没说的是:这一切,建立在全栈工程能力之上——
Trainium 3/4自研芯片(每兆瓦token输出提升5倍),
Nova 2 Omni多模态模型
再到AgentCore安全框架(确保金融级合规)。

Agent不是空中楼阁,而是地基之上的高楼


03


泼冷水的人:Agent的三大“致命短板”

然而,就在亚马逊高调宣布“Agent时代已来”时,另一群人却在泼冷水。

36氪采访的多位美国开发者直言:

“市面上的软件,根本没做好被Agent调用的准备。”

这背后,是Agent落地的三大现实困境:

1. 成本黑洞:80%花在推理上

Pokee.AI CEO朱哲清公开表示:

“AI Agent的成本,80–90%都在推理。若不能将推理成本打下80%,就不可能盈利。”

VC已开始追问每家Agent初创公司:

“你的订阅费,能cover推理成本吗?”

这意味着:Develop for Cost(为低成本开发),正成为新竞争力。

2. 生态割裂:软件是为人,不是为AI设计的

Anthropic产品负责人指出:

“AI讨厌数据孤岛。当它面对几十个API、分散的权限、不一致的UI,注意力一分散,就‘智力下降’。”

当前软件架构,是人类中心主义的产物: 

  • 需要点击、滑动、理解上下文; 
  • 缺乏机器可读的意图接口; 
  • 权限模型不支持Agent代理操作。

Agent需要的,是一套“AI-first”的软件革命——
比如,为AI设计类似SQL的交互语言,统一任务调度协议。

3. 安全与信任:谁为Agent的行为负责?

豆包手机助手刚发布,就被微信封杀;
字节与头部手机厂商谈判破裂,因对方“不愿开放系统权限”。

为什么?

因为Agent一旦失控,后果远超聊天机器——它能转账、删数据、发消息、签合同。

亚马逊的解法是AgentCore:提供可观测性、控制策略与行为审计,确保每一步可追溯、可回滚、可问责。

但大多数初创公司,连基础监控都没有。


04


真正的胜负手:从“模型能力”到“工程体系”

NeurIPS与re:Invent的对比,揭示了AI下半场的真实规则:

NeurIPS 与 re:Invent 背后,AI正在从“模型竞赛”转向“工程硬仗”(图3)

未来属于谁?

  • 不是论文最多的高校, 
  • 也不是Demo最炫的初创公司, 
  • 而是能将Agent嵌入企业生产流程、并证明可规模化ROI的平台型公司

亚马逊之所以敢说“数十亿Agents将重构产业”,
是因为它已构建从芯片→模型→Agent→行业解决方案的全栈能力

而OpenAI、Google、字节、蚂蚁,也都在构建自己的“工程护城河”:




结语

真正的Agent,从不喧哗

NeurIPS告诉我们:AI的创新引擎,正从硅谷向北京、上海迁移
re:Invent证明:AI的价值,不在参数多大,而在落地多深
美国AI春晚的那盆“凉水”,则提醒我们:Agent不是魔法,而是需要十年磨一剑的工程硬仗

未来的胜负,不在于谁喊出“通用智能体”的口号,
而是那些把“灵光一闪”,变成“可运行系统”的人

技术从不温柔,但它永远奖励脚踏实地的人

Agent 的夏天,或许刚被一盆凉水浇醒;
但真正的建造者,本就不靠热度,而靠深度。


参考资料: 

 NeurIPS 2025 OpenReview 全量数据分析

re:Invent 2025 官方发布会实录

《美国AI春晚,一盆凉水浇在Agent身上》(36氪)

欢迎转发、点赞、在看——看清AI落地的真实战场。




下一站预告




#AI+产品创新峰会· 2026上海站

返回列表