Harnessing Claude 打造高效、低成本、可进化的 AI 应用

张开发
2026/4/7 7:40:10 15 分钟阅读

分享文章

Harnessing Claude 打造高效、低成本、可进化的 AI 应用
在 AI 技术飞速迭代的今天Anthropic 联合创始人 Chris Olah 的一句话道出了生成式 AI 的本质Claude 这类大模型不是被 “搭建” 出来的而是被 “培育” 成长的。研究人员设定成长规则却无法精准预判它会涌现出怎样的能力。这给开发者带来了一个核心难题我们为 Claude 搭建的智能体框架Agent Harness总是基于 “它做不到什么” 的假设可这些假设会随着 Claude 的进化快速失效。昨天的最优解可能成为今天的性能瓶颈曾经为弥补短板设计的逻辑转眼变成冗余负担。如何让 AI 应用跟上 Claude 的进化速度同时平衡延迟、成本与体验Anthropic 官方团队总结出三大黄金开发范式既是技术指南更是 AI 应用开发的底层逻辑读懂就能少走弯路。一、善用既有能力别重复造轮子用好 Claude 天生精通的工具很多开发者陷入误区为了实现特定功能费尽心思为 Claude 开发专属工具却忽略了它早已熟练掌握的核心能力。最高效的开发是依托 Claude 的原生能力搭建应用。2024 年末Claude 3.5 Sonnet 仅凭两款通用工具 ——bash 命令工具、文本编辑器工具支持文件查看 / 创建 / 编辑就在权威软件工程测试 SWE-bench Verified 中拿下 49% 的准确率登顶当时全球最佳水平而 Claude Code 正是基于这两款工具打造。bash 并非为智能体设计却是 Claude 越用越精通的工具。更关键的是Claude 能自主组合这些通用工具衍生出高阶能力智能体技能Agent Skills程序化工具调用记忆工具这些复杂功能本质都是 bash 与文本编辑器的组合应用。不用追求 “专属定制”用好模型已吃透的工具就能实现远超预期的效果。二、停止过度干预把决策权还给 Claude减负就是提效智能体框架的本质是固化了 “Claude 无法自主完成” 的假设。但随着模型进化这些假设必须被打破 ——你替 Claude 做的决定越多越限制它的智能发挥。个人感受AI给出的方案已经远超普通大众给出的方案也就是之前说的我们需要用AI实现自己的思想的跃升。真正高效的开发是不断追问我可以停止做什么让 Claude 自主编排操作告别无效token消耗传统开发逻辑所有工具结果都必须传回 Claude 上下文窗口才能进行下一步。但这会造成巨大浪费读取大型表格时无关数据会占用大量token耗时又费钱。即便用硬编码过滤也是框架替 Claude 做了本应由它决定的事。解决方案给 Claude 配备代码执行工具bash/REPL。Claude 能自主编写代码定义工具调用逻辑自主筛选、传递、衔接工具结果无需占用上下文窗口只有最终执行结果会传入模型。实测效果惊人在网页浏览测试 BrowseComp 中Opus 4.6 凭借自主编排能力准确率从 45.3% 飙升至 61.6%。代码能力越强Claude 的通用智能体能力就越出众。让 Claude 自主管理上下文拒绝注意力浪费传统做法人工编写系统提示词把所有任务指令预加载进去。弊端多任务场景下极少用到的指令会占用 Claude 的 “注意力预算”导致性能下降。解决方案用技能调用 上下文编辑 子智能体三重能力让 Claude 自主管理上下文。技能调用仅预加载简短描述需要时再调取完整内容不浪费token上下文编辑主动清除失效信息保留核心内容子智能体创建独立上下文专项任务专项处理。Opus 4.6 凭借子智能体能力BrowseComp 成绩再提升 2.8%真正实现 “精准聚焦不做无用功”。让 Claude 自主持久化上下文长周期任务不再掉线长周期任务很容易超出上下文窗口限制传统方案依赖外围检索架构复杂又低效。Anthropic 给出极简方案让 Claude 自己管理记忆。上下文压缩自主总结过往内容保障长任务连贯性记忆文件夹自主写入、读取文件存储关键信息。效果差距一目了然旧版 Sonnet 3.5 玩《宝可梦》只会机械记录 NPC 对话14000 步生成 31 个冗余文件新版 Opus 4.6会自动整理战术笔记10 个文件归类清晰还能总结失败经验游戏进度大幅领先。从 “机械记录” 到 “策略思考”Claude 的记忆能力全靠自主掌控实现质变。三、精准设定边界框架不限制智能只守护规则智能体框架不是 Claude 的 “枷锁”而是用户体验、成本、安全的守护者。无需限制模型能力只需做好三件事最大化缓存命中率成本直降 90%Claude 的 API 无状态每轮交互都需要打包全量上下文而缓存token成本仅为基础token的 10%。遵循 5 大原则缓存利用率拉满静态内容前置系统提示、工具说明放最前面消息更新用system-reminder追加内容不修改原提示不切换模型缓存与模型绑定切换即失效谨慎管理工具增删工具会清空缓存动态工具用搜索替代动态更新断点多轮交互中及时移动缓存断点。小改动大收益轻松实现 “降本增效”。声明式工具划定安全与体验边界Claude 不懂应用的安全规则和用户交互逻辑bash 工具权限过大存在风险。解决方案将高风险、高交互操作转化为专用声明式工具安全层面外部 API 调用增设用户确认文件编辑加入过期校验体验层面用户交互转为弹窗阻塞智能体等待反馈可观测性结构化参数方便日志记录、追踪复现。高风险动作严格管控常规操作放开发挥平衡安全与效率。四、未来启示AI 应用开发要学会 “做减法”Claude 的智能边界一直在拓展今天的 “能力短板”明天可能就变成 “核心优势”。Anthropic 团队亲身验证Sonnet 4.5 存在 “上下文焦虑”接近上限会提前终止任务团队专门开发了上下文重置功能可到了 Opus 4.5这个问题彻底消失曾经的补救逻辑变成了冗余代码反而拖累性能。AI 应用开发的终极智慧是持续 “做减法”。每一次 Claude 迭代都要重新审视哪些假设已经失效哪些逻辑可以删除哪些干预可以停止不要让昨天的解决方案成为今天的性能瓶颈。写在最后驾驭 Claude 的智能核心不是 “控制它”而是 “成就它”善用既有能力不做无用功停止过度干预释放模型潜力精准设定边界平衡效率与安全。在 AI 快速进化的时代最好的应用不是 “固化的成品”而是能跟着模型一起成长的生态。掌握这三大范式你打造的不仅是一款 AI 应用更是能持续迭代、始终领先的核心竞争力。

更多文章