Agentic OS 架构设计

【Agentic = Harness+大模型】模型做决策,Harness做执行。

Agentic OS Architecture

Harness = Agent 在特定领域工作所需要的一切

Harness 因领域而变,Agent 跨领域泛化。Agent的那个智能决策者,永远是模型。

Tools

工具

文件读写、Shell、网络、数据库、浏览器

Knowledge

知识

产品文档、领域资料、API 规范、风格指南

Observation

观察反馈

git diff、错误日志、浏览器状态、传感器数据

Action

行动

CLI 命令、API 调用、UI 交互

Permissions

权限控制

沙箱隔离、审批流程、信任边界

Harness 因领域而变

编程 agent 的 harness 是 IDE、终端和文件系统。农业 agent 的 harness 是传感器阵列、灌溉控制和气象数据。

🏠

庄园管理

物业传感器 + 维护工具 + 租户通信

🌾

农业运营

土壤/气象数据 + 灌溉控制 + 作物知识

🏨

酒店运作

预订系统 + 客户渠道 + 设施 API

🔬

医学研究

文献检索 + 实验仪器 + 协议文档

🏭

制造业

产线传感器 + 质量控制 + 物流系统

📚

教育培训

课程知识 + 学生进度 + 评估工具

核心职责

Harness 工程师到底在做什么

你不是在编写智能。你是在构建智能栖居的世界。

实现工具

给 agent 一双手。文件读写、Shell 执行、API 调用、浏览器控制、数据库查询。每个工具都是 agent 在环境中可以采取的一个行动。设计它们时要原子化、可组合、描述清晰。

策划知识

给 agent 领域专长。产品文档、架构决策记录、风格指南、合规要求。按需加载,不要前置塞入。Agent 应该知道有什么可用,然后自己拉取所需。

管理上下文

给 agent 干净的记忆。子 agent 隔离防止噪声泄露。上下文压缩防止历史淹没。任务系统让目标持久化到单次对话之外。

控制权限

给 agent 边界。沙箱化文件访问。对破坏性操作要求审批。在 agent 和外部系统之间实施信任边界。这是安全工程与 harness 工程的交汇点。

造好 harness,大模型会完成剩下的。

Agent看得清不清、动作准不准、知识够不够,直接决定它能不能把大模型的能力真正用出来。Harness 是 Agent 的「手脚」和「眼睛」。

大师课

为什么是 Claude Code,【Coding Agent≈通用 Agent】

Claude Code 是我们所见过的最优雅、最完整的 agent harness 实现。它没有试图成为 agent 本身,它给模型提供了工具、知识、上下文管理和权限边界。 ClaudeCode 是一套面向代码场景的 Agent 架构,核心是:主Agent(Claude.md)+规则约束rules+技能skills+Mcp tools+记忆memory+指令commands+分布式调度subAgents共同构成一个可扩展、可调度、可长期运行的代码智能体系统。

Claude Code 架构拆解

  • Agent Loop 循环
  • 工具 (bash, read, write, edit, glob, grep, browser...)
  • 按需 Skill 加载
  • 上下文压缩及长期记忆
  • 子 Agent 派生
  • 带依赖图的任务系统
  • 异步邮箱的团队协调
  • Worktree 隔离的并行执行
  • 权限治理

核心启示

Claude Code 展示了当你信任模型、把工程精力集中在 harness 上时会发生什么。

Harness 没有让 Claude大模型 变聪明。Claude大模型 本来就聪明。Harness 给了 Claude大模型 手脚、眼睛和一个工作空间

最好的 agent 产品,出自那些明白自己的工作是 harness 而非 intelligence 的工程师之手。
顶级 Agent 开发者,不试图自己造智能,而是造一套能驯服、放大、稳定发挥大模型能力的系统。

每一个人类从事复杂、多步骤、需要判断力工作的领域,都是 agent 可以运作的领域 -- 只要有对的 harness。

Bash is all you need. Agentic: Think less, execute more, loop forever.

万物皆可 Bash,智能当如是:少空想,多执行,循环不止。