Agentic OS 架构设计

【Agentic = Harness+大模型】模型做决策，Harness做执行。

Harness = Agent 在特定领域工作所需要的一切

Harness 因领域而变，Agent 跨领域泛化。Agent的那个智能决策者，永远是模型。

Tools

工具

文件读写、Shell、网络、数据库、浏览器

Knowledge

知识

产品文档、领域资料、API 规范、风格指南

Observation

观察反馈

git diff、错误日志、浏览器状态、传感器数据

Action

行动

CLI 命令、API 调用、UI 交互

Permissions

权限控制

沙箱隔离、审批流程、信任边界

Harness 因领域而变

编程 agent 的 harness 是 IDE、终端和文件系统。农业 agent 的 harness 是传感器阵列、灌溉控制和气象数据。

🏠

庄园管理

物业传感器 + 维护工具 + 租户通信

🌾

农业运营

土壤/气象数据 + 灌溉控制 + 作物知识

🏨

酒店运作

预订系统 + 客户渠道 + 设施 API

🔬

医学研究

文献检索 + 实验仪器 + 协议文档

🏭

制造业

产线传感器 + 质量控制 + 物流系统

📚

教育培训

课程知识 + 学生进度 + 评估工具

核心职责

Harness 工程师到底在做什么

你不是在编写智能。你是在构建智能栖居的世界。

实现工具

给 agent 一双手。文件读写、Shell 执行、API 调用、浏览器控制、数据库查询。每个工具都是 agent 在环境中可以采取的一个行动。设计它们时要原子化、可组合、描述清晰。

策划知识

给 agent 领域专长。产品文档、架构决策记录、风格指南、合规要求。按需加载，不要前置塞入。Agent 应该知道有什么可用，然后自己拉取所需。

管理上下文

给 agent 干净的记忆。子 agent 隔离防止噪声泄露。上下文压缩防止历史淹没。任务系统让目标持久化到单次对话之外。

控制权限

给 agent 边界。沙箱化文件访问。对破坏性操作要求审批。在 agent 和外部系统之间实施信任边界。这是安全工程与 harness 工程的交汇点。

造好 harness，大模型会完成剩下的。

Agent看得清不清、动作准不准、知识够不够，直接决定它能不能把大模型的能力真正用出来。Harness 是 Agent 的「手脚」和「眼睛」。

大师课

为什么是 Claude Code，【Coding Agent≈通用 Agent】

Claude Code 是我们所见过的最优雅、最完整的 agent harness 实现。它没有试图成为 agent 本身，它给模型提供了工具、知识、上下文管理和权限边界。 ClaudeCode 是一套面向代码场景的 Agent 架构，核心是：主Agent(Claude.md)+规则约束rules+技能skills+Mcp tools+记忆memory+指令commands+分布式调度subAgents共同构成一个可扩展、可调度、可长期运行的代码智能体系统。

Claude Code 架构拆解

Agent Loop 循环
工具 (bash, read, write, edit, glob, grep, browser...)
按需 Skill 加载
上下文压缩及长期记忆
子 Agent 派生
带依赖图的任务系统
异步邮箱的团队协调
Worktree 隔离的并行执行
权限治理

核心启示

Claude Code 展示了当你信任模型、把工程精力集中在 harness 上时会发生什么。

Harness 没有让 Claude大模型变聪明。Claude大模型本来就聪明。Harness 给了 Claude大模型手脚、眼睛和一个工作空间。

最好的 agent 产品，出自那些明白自己的工作是 harness 而非 intelligence 的工程师之手。
顶级 Agent 开发者，不试图自己造智能，而是造一套能驯服、放大、稳定发挥大模型能力的系统。

每一个人类从事复杂、多步骤、需要判断力工作的领域，都是 agent 可以运作的领域 -- 只要有对的 harness。

Bash is all you need. Agentic: Think less, execute more, loop forever.

万物皆可 Bash，智能当如是：少空想，多执行，循环不止。