2026.1.4 - Agent
尝试复刻Cursor官网的网页觉得挫败,又转回来看看Agent。
https://01.me/2025/12/silicon-valley-ai-insights-2025/
AI编程效果那里的大厂日常开发感觉很好笑,写代码的时间非常有限只有15%,真的不喜欢这样。
Research Code可以用来写写智能体写写脚本啥的。
基础设施代码,包括Linux内核还有共识协议,都不太行。
vibe coding最佳实践就是拆分,一次生成尽可能少的代码。
还有一个就是TDD测试驱动开发,说实话我觉得这个比Ralph开发要靠谱一点…
大型重构的spec很重要,我看还有根据spec来写linux内核的文件系统的论文…不知道效果如何。
严格的evaluation system也是积累代码数据的过程啊,现在大家都知道数据很重要了,每家公司都会构造数据集。
硅谷巨头的一些情况真的是长见识了。
初创公司的启示我觉得也很有帮助,实际上初创需要找到自己在整个行业的生态位,不能做通用领域因为大企业都会做,要找到非常细分的垂直领域
我觉得一定不能脱离工程实践,只有自己亲手去尝试,才能获得对一个工作的最真实的感受,vibe coding也好,训模型也好,不能道听途说,要自己去尝试。
技术实践
Context Engineering框架
- System Prompt
- Tools
- Data Retrieval
- Long Horizon Optimizations 长期任务优化
Data-Retrieval 范式转变
新方法是 just in time 即时加载
- 策略一:轻量级标识符
- 渐进式披露
- 自主探索
所有模型在长上下文上都会出现性能下降
当超出context window容量时的解决方案
- 上下文压缩
- Agent 维护显式的记忆工件,存储”工作笔记”:决策、学习、状态。按需检索,而非保存在上下文中
- Sub-Agent。将复杂任务分解为专门的 Agent,每个 Sub-Agent 有专注、清晰、狭窄的上下文。main agent编排并且综合结果
Skills机制的工作机理
Claude 可以动态发现和加载
pdf/SKILL.md (主文件)
├── YAML Frontmatter (name, description)
├── Overview (概述)
└── References: "For advanced features, see /reference.md"
pdf/reference.md (详细参考)
└── Advanced PDF processing features...
pdf/forms.md (专门功能)
└── PDF form filling instructions...
- Memory(记忆)
- Sub Agents & Collaboration(子 Agent 与协作)
- Dynamic Tool Calls(动态工具调用)
- Code Generation & Execution(代码生成与执行)
- Web Search(网页搜索)
- Agentic Search(Agent 搜索)
- Long Running Tasks(长期运行任务)