2026.1.4 - Agent

尝试复刻Cursor官网的网页觉得挫败,又转回来看看Agent。
https://01.me/2025/12/silicon-valley-ai-insights-2025/
AI编程效果那里的大厂日常开发感觉很好笑,写代码的时间非常有限只有15%,真的不喜欢这样。
Research Code可以用来写写智能体写写脚本啥的。
基础设施代码,包括Linux内核还有共识协议,都不太行。

vibe coding最佳实践就是拆分,一次生成尽可能少的代码。
还有一个就是TDD测试驱动开发,说实话我觉得这个比Ralph开发要靠谱一点…
大型重构的spec很重要,我看还有根据spec来写linux内核的文件系统的论文…不知道效果如何。

严格的evaluation system也是积累代码数据的过程啊,现在大家都知道数据很重要了,每家公司都会构造数据集。
硅谷巨头的一些情况真的是长见识了。
初创公司的启示我觉得也很有帮助,实际上初创需要找到自己在整个行业的生态位,不能做通用领域因为大企业都会做,要找到非常细分的垂直领域
我觉得一定不能脱离工程实践,只有自己亲手去尝试,才能获得对一个工作的最真实的感受,vibe coding也好,训模型也好,不能道听途说,要自己去尝试。

技术实践

Context Engineering框架

  • System Prompt
  • Tools
  • Data Retrieval
  • Long Horizon Optimizations 长期任务优化

Data-Retrieval 范式转变
新方法是 just in time 即时加载

  • 策略一:轻量级标识符
  • 渐进式披露
  • 自主探索

所有模型在长上下文上都会出现性能下降
当超出context window容量时的解决方案

  • 上下文压缩
  • Agent 维护显式的记忆工件,存储”工作笔记”:决策、学习、状态。按需检索,而非保存在上下文中
  • Sub-Agent。将复杂任务分解为专门的 Agent,每个 Sub-Agent 有专注、清晰、狭窄的上下文。main agent编排并且综合结果

Skills机制的工作机理
Claude 可以动态发现和加载

pdf/SKILL.md (主文件)
├── YAML Frontmatter (name, description)
├── Overview (概述)
└── References: "For advanced features, see /reference.md"

pdf/reference.md (详细参考)
└── Advanced PDF processing features...

pdf/forms.md (专门功能)
└── PDF form filling instructions...
  • Memory(记忆)
  • Sub Agents & Collaboration(子 Agent 与协作)
  • Dynamic Tool Calls(动态工具调用)
  • Code Generation & Execution(代码生成与执行)
  • Web Search(网页搜索)
  • Agentic Search(Agent 搜索)
  • Long Running Tasks(长期运行任务)

© Shemol 2022 - 2026