2026.1.4 - Agent
lang
zh-CN
en-US
date
Jan 5, 2026
slug
2026-1-4-agent
status
Published
tags
Agent
summary
对agent复习一下
type
Post
尝试复刻Cursor官网的网页觉得挫败,又转回来看看Agent。
AI编程效果那里的大厂日常开发感觉很好笑,写代码的时间非常有限只有15%,真的不喜欢这样。
Research Code可以用来写写智能体写写脚本啥的。
基础设施代码,包括Linux内核还有共识协议,都不太行。
vibe coding最佳实践就是拆分,一次生成尽可能少的代码。
还有一个就是TDD测试驱动开发,说实话我觉得这个比Ralph开发要靠谱一点…
大型重构的spec很重要,我看还有根据spec来写linux内核的文件系统的论文…不知道效果如何。
严格的evaluation system也是积累代码数据的过程啊,现在大家都知道数据很重要了,每家公司都会构造数据集。
硅谷巨头的一些情况真的是长见识了。
初创公司的启示我觉得也很有帮助,实际上初创需要找到自己在整个行业的生态位,不能做通用领域因为大企业都会做,要找到非常细分的垂直领域
我觉得一定不能脱离工程实践,只有自己亲手去尝试,才能获得对一个工作的最真实的感受,vibe coding也好,训模型也好,不能道听途说,要自己去尝试。
技术实践
Context Engineering框架
- System Prompt
- Tools
- Data Retrieval
- Long Horizon Optimizations 长期任务优化
Data-Retrieval 范式转变
新方法是 just in time 即时加载
- 策略一:轻量级标识符
- 渐进式披露
- 自主探索
所有模型在长上下文上都会出现性能下降
当超出context window容量时的解决方案
- 上下文压缩
- Agent 维护显式的记忆工件,存储”工作笔记”:决策、学习、状态。按需检索,而非保存在上下文中
- Sub-Agent。将复杂任务分解为专门的 Agent,每个 Sub-Agent 有专注、清晰、狭窄的上下文。main agent编排并且综合结果
Skills机制的工作机理
Claude 可以动态发现和加载
- Memory(记忆)
- Sub Agents & Collaboration(子 Agent 与协作)
- Dynamic Tool Calls(动态工具调用)
- Code Generation & Execution(代码生成与执行)
- Web Search(网页搜索)
- Agentic Search(Agent 搜索)
- Long Running Tasks(长期运行任务)