告别 RAG：AI Agent 的 470 亿宇宙正在颠覆一切

我将深入剖析 Claude 4.8 和 Gemini 3.5 如何凭借强大的上下文记忆和推理能力，终结了 RAG 的时代，并引爆了价值 470 亿美元的 AI Agent 革命。我们将探讨这一转变背后的技术动因、市场影响以及我对此的独到见解。

终结 RAG：内卷的终点，解放的起点

2025 年底以来，AI 领域最让人津津乐道的，莫过于 Claude 4.8（尤其是 Opus 版本）和 Gemini 3.5 系列模型的惊艳表现。它们不再是过去 GPT-4 时代靠着“检索增强生成”（RAG）来弥补长文本理解和记忆短板的“拼凑式”智能。我必须说，RAG 确实在很长一段时间里撑起了大模型应用的半边天，让那些原本难以回答复杂问题、需要查阅大量资料的场景变得可行。但现在，随着 Claude 4.8 和 Gemini 3.5 动辄数百万甚至千万 token 的上下文窗口，以及它们在上下文内保持高度连贯性和准确性的推理能力，RAG 的生存空间被极大压缩了。

想想看，过去我们为了让模型理解一篇厚厚的报告，得费尽心思地做 embedding，设计复杂的向量数据库检索策略，还得担心召回率和精确度。现在呢？直接把报告扔进去，模型就能“一口气”读完，并且能精准回忆起其中的细节，进行深度分析。这种“原生”的长文本理解和推理能力，让 RAG 显得如此笨拙和低效。我敢说，在 2026 年，还在大力推 RAG 解决方案的，要么是还没跟上技术迭代，要么就是还在啃“旧馒头”。

470 亿的新大陆：AI Agent 的真正爆发

RAG 的落幕，并非 AI 应用的倒退，恰恰相反，它是通往更高级智能形态——AI Agent——的必经之路。一旦模型能够“全盘通晓”并“融会贯通”，它就能从一个被动的信息处理者，跃升为主动的“行动者”。这正是 470 亿美元（我看到的最新市场估值，还在快速增长）AI Agent 革命的核心。

Claude 4.8 和 Gemini 3.5 的强大内驱力，使得 Agent 不再是简单的“指令-执行”序列。它们可以理解更复杂、更抽象的任务目标，自主规划一系列步骤，调用各种工具（API、软件、甚至与其他 Agent 协作），并在执行过程中根据实时反馈进行自我纠错和优化。我看到很多创业公司已经开始在金融分析、软件开发、科研实验设计等领域推出极其精密的 Agent。

比如，一个基于 Claude 4.8 Opus 的金融分析 Agent，不仅能阅读并分析公司年报，还能自主追踪最新的宏观经济数据，预测市场波动，甚至模拟不同投资策略的潜在收益。它不再需要我们一步步告诉它“去查这个，然后分析那个”，而是直接问它：“帮我制定一个应对下季度通胀超预期的投资组合。” 然后它就能给出完整的方案，包括理由和风险评估。

端侧推理与多模态：AI Agent 的双翼

当然，AI Agent 的广泛应用，也离不开另外两大热点：端侧推理和多模态。

端侧推理（On-device AI）让强大的 Agent 能够摆脱对云端算力的依赖，在用户的手机、笔记本甚至汽车里运行。这意味着更快的响应速度、更好的隐私保护，以及在网络不佳环境下也能正常工作。我设想的未来，很多日常任务（如智能日程管理、健康监测、个性化推荐）将完全由设备本地运行的 Agent 来处理，用户体验将是无缝且即时的。

而多模态能力的飞跃，更是让 AI Agent 的“感知”和“交互”能力达到了新的高度。Claude 4.8 和 Gemini 3.5 不仅能理解文字，还能“看懂”图片、视频、音频，甚至理解复杂的图表和代码。这意味着 Agent 可以分析医学影像，解读工程图纸，理解演示视频的内容，并用最适合的方式（文字、语音、甚至生成的图表）来回应我们。我最近看到的一些 demo，Agent 能够观看一段教学视频，然后生成一份总结性的操作指南，这简直是学习和培训领域的颠覆。

我的观点：拥抱 Agent，警惕“伪 Agent”

我坚信，AI Agent 革命才刚刚开始，它将深刻改变我们工作、生活乃至思考的方式。我们正从“人找信息”的时代，迈入“信息找人”甚至“智能体为我服务”的时代。

但在此过程中，我们也需要保持警惕。市场上充斥着大量打着“Agent”旗号的伪产品。它们可能只是简单的脚本自动化，或者一个套着 RAG 外壳的“智能客服”。真正的 AI Agent，应该具备自主规划、学习、适应和纠错的能力，能够处理非结构化、高度动态的任务。

作为一名科技观察者，我将持续关注 Claude 4.8、Gemini 3.5 以及未来可能出现的更强大的模型，它们将如何进一步驱动 Agent 的进化，以及这个价值 470 亿美元（且可能远不止于此）的市场将走向何方。这是一个激动人心的时代，AI 不再是遥不可及的科幻，而是触手可及的现实，它正在重塑我们对智能的定义。

转载请注明出处：罗可龙的博客 | 联系邮箱：[email protected]

罗可龙简介

产品矩阵

告别 RAG：AI Agent 的 470 亿宇宙正在颠覆一切

终结 RAG：内卷的终点，解放的起点

470 亿的新大陆：AI Agent 的真正爆发

端侧推理与多模态：AI Agent 的双翼

我的观点：拥抱 Agent，警惕“伪 Agent”