
文|Lambda
剪辑|晓静
4 月初,Hermes Agent 火了。这个名字径直让东谈主联念念到挥霍牌爱马仕,是以也被戏称为"爱马仕 Agent "。
它由 Nous Research 在 2 月发布,定位是「The agent that grows with you」。中枢卖点是一个闭环学习系统:Agent 完成复杂任务后,自动把告诫固化成 Skill,下次遭遇访佛任务径直复用,还能在使用过程中连续立异。Skill 自动生成、越用越强——这是 Agent 界限面前最有眩惑力的叙事之一。
但这个叙事避讳了一个更基本的问题:Skill 确切是现时 Agent 落地的主要瓶颈吗?

图片由 AI 生成
01 Skill 很性感,但它可能不是最热切的问题
一个容易被忽略的事实是:面前公认体验最佳的编程 Agent 产物之一—— Claude Code,它好用的基石并不是 Skill 的自动进化,而是背后无数塌实的 CLI 器具相沿。
用 GlobTool 找候选文献,用 GrepTool 定位磋商代码片断,用 FileReadTool 稽查达成细节,用 LSPTool 作念代码标志跳转和援用分析。每一个都是笃定性的、零 token 蹧跶的原子操作。
但东谈主们很少为这些器具写故事。只消一提到 Agent 能自动生成 Skill、还能连续进化,统统这个词行业坐窝就承诺起来。
这个反差评释了一件事:CLI (大喊行界面)不性感,不好讲故事,但它才是 Agent 身手的确切地基。
地基不牢,Skill 再见长,也仅仅长在沙地上。
02 龙虾最被东谈主诟病的方位,Skill 自主进化处理不了
这件事放到 OpenClaw(俗称‘龙虾") 身上会看得更明晰。
OpenClaw 最被东谈主诟病的两点,一是 token 蹧跶大、账单吃不用,二是永劫辰责任踏实性差、往往失联。乍一看是两个问题;往下拆,会发现它们往走动自吞并个起源:Agent 在用劣质器具——比如脆弱的浏览器自动化——去完资本该由笃定性器具完成的任务。
这类资本在社区里并非概括的衔恨,而有无数具体案例。
Reddit 上有 OpenClaw 用户提到,我方仅仅念念自动化 X 账号发帖,三次尝试就花掉了 10 好意思元,任务还没确切跑通。还有东谈主在 r/automation 里直言,面前许多所谓的 AI Agent 浏览器已矣,本色上仅仅「披着智能外套的脆弱自动化」——问题不在模子有多笨,而在底层器具自己就不可靠。页面一变、DOM 一改、按钮状况一抖,Agent 就只可一遍遍不雅察、一遍遍重试、一遍遍再行谋划。
而这些「失败但不致命」的试错过程,并不会因为任务没完竖立免费——每一次不雅察页面、分析状况、决定下一步,都在赓续蹧跶 token。
于是,踏实性问题和资本问题,其实是吞并个问题的两面:器具越脆弱,试错越多;试错越多,token 烧得越快;任务链越长,失联和中断的概率也越高。
从这个角度看,Skill 自主进化处理的是「怎么更灵巧地使用一个器具」,但并莫得处理「好器具自己稀缺」的问题。Skill 不错让 Agent 更练习地摆布一匹跛脚马,但并不成把跛脚马变成沉马。
这才是今天许多 Agent 系统确切卡住的方位:不是 Skill 不够强,而是下面能和洽的高质地原子器具太少。
03 Skill 是对模子身手的补丁
Hermes 作念的事情,本色上是把 Skill 的生成和优化自动化——让 Agent 从告诫中蒸馏学问,不再需要东谈主手写。这如实处理了一个真实痛点。
但 Skill 自己有一个更深层的问题:它是当然说话驱动的,本色上是模子身手的蔓延,概况说,是一种对模子身手的假贷。
近况是,无数 Agent 在用 Skill 加上自主解题身手,完资本该由 CLI 完成的事情——比如以恶果低下的浏览器自动化决策查一个股票价钱、下载一张图片、提交一个表单。代价很明晰:贵、慢、不踏实、调试难。
这里还有一个常见的清楚误区,不错叫作念「Skill 可挪动幻觉」:许多东谈主合计,用强模子写出来的 Skill,不错无缝挪动给弱模子用。现实上不成。Skill 是当然说话指示,它对模子身手有隐性依赖;模子一换,算作就可能变。CLI 则不同——它是代码:通常的输入,恒久给你通常的输出,无论下面跑的是什么模子。
二者的区别相称明显:
Skill 调试难,CLI 调试容易;
Skill 烧 token,CLI 近乎零蹧跶;
Skill 吃模子版块,CLI 不吃;
Skill 是语义层钞票,CLI 是彭胀层钞票。
要是把 Skill 当成中枢积贮标的,本色上是把赌注压在模子身手的踏实性上。至少在现时阶段,更值得积贮的是高质地 CLI。
04 当器具和盘曲文充足好时,Skill 的优先级会当然下落
上头的分析也能从 Anthropic 我方的产物告诫里取得印证。
Anthropic 的筹算崇拜东谈主、Cowork 产物的筹算主导者 Jenny Wen 在近期访谈中提到一个细节:她个东谈主其实不怎么用 Cowork 的 Skills 功能。原因不是她含糊 Skill,而是她在 Cowork 里挂载了一个文献夹,内部有我方耐久积贮的个东谈主札记、一双一会议纪录、顺手念念法和责任不雅察。对她来说,Cowork 从这些材料里还是学到了充足的信息,以至于她对 Skill 和 Memory 的需求都被显赫减弱了。
这并不是说 Skill 莫得价值,而是说:当盘曲文管理充足好、底层器具充足强时,Skill 的优先级会当然下落。
换言之,Hermes 所强调的 Skill 自主进化并不是错,而是它处理的问题很可能莫得念念象中那么基础。
05 有一件事正在暗暗发生:CLI 的使用者,从东谈主变成了 Agent
要是说 Skill 处理的是欺诈层的编排问题,那么更底层的变化发生在 CLI 上。
畴昔,CLI 是为东谈主筹算的。给东谈主用的 CLI 不错有交互请示,不错容忍笼统输出,也不错在文档不全的期间靠用户我方猜——因为东谈主会停驻来,会清楚歧义,会重试,会去查文档。
Agent 不一样。
Agent 不寝息,残害忍歧义,会并发,会在莫得预念念到的时机无尽重试。一个对东谈主类来说「强迫能用」的 CLI,对 Agent 来说可能等于高频事故源。
给 Agent 用的 CLI 必须得志一组王人备不同的条款:
一条大喊只产出一个明确收尾;
输出是结构化的 JSON;
不实信息不仅告诉你那儿错了,还要告诉 Agent 下一步该怎么办;
长任务必须维持异步,不成让 Agent 傻等;
接口自然维持幂等、重试和并发。
背后只好一句话:以前的软件默许使用者要寝息、会分神、有耐性;面前 Agent 不得志这些前提。
一朝使用者从东谈主变成 Agent,CLI 的筹算形而上学就需要重新重写。Agent 确切在乎的是 token 蹧跶、缓存掷中率、幻觉已矣、长程踏实性,而不是「这个大喊看起来是否优雅」。
06 浏览器里能看到的,都值得被 CLI 化
有一个实验很能评释问题:把 ChatGPT 的网页版变成一个不错被 Agent 调用的 CLI。
作念法并不深奥——通过 Chrome CDP 条约径直驱动浏览器,操作 DOM,填输入框,点发送,恭候翰墨出现,再把收尾捏下来。因为复用了已有登录态,算作上和东谈主在浏览器里操作莫得本色区别。
这个实验背后更大的瞻念察是:浏览器里能看到的,原则上都不错被 CLI 化。
不仅仅 ChatGPT —— Gemini、音乐生成、视频生成、股票图表,只消能在浏览器里完成的经由,都不错被代码重迭彭胀,临了料理成一条 Agent 可调用的大喊。
一朝一个 Web 经由被 CLI 化,它就会从「需要 Agent 一步步盯着网页试错」的经由,变成「可并发、可异步、可幂等的原子操作」。本来要靠浏览器自动化蹧跶无数 token 才能完成的事,被压缩成了一条大喊、一个结构化收尾。
某种好奇上,这是一条很反直观但相称现实的优化旅途:纯粹 token 的关节,不是少让 Agent 干活,而是先烧少量 token,把高频经由预制成 CLI。磨刀不误砍柴工。
这个逻辑也不单适用于 Web。桌面欺诈和手机 App,本色上都不错被迟缓 CLI 化,what you see is what can cli。面前已有不少开源名目在分手鼓吹这三个标的,仅仅三者之间还莫得变成合伙的筹算说话和引起人人充足的爱好。
07 分层才是终态
Agent 的畴昔,除了模子自己的提高,更取决于如何处理好两种逻辑:笃定性逻辑和语义逻辑。
前者靠 CLI,后者靠 Skill 的自顺应和进化。Hermes 处理的是后者,但前者才是今天许多系统确切缺的底座。
要是把 CLI 化推到极致,会出现一件很反直观的事:一类经由王人备固定的任务,Agent 只需要判断任务类型、路由到对应 CLI、拿收尾总结——这个过程表面上致使不需要 LLM,几个 if-else 就够了。你致使不错用代码去模拟 LLM 的输入输出接口,零 token、零延迟,赓续复用现存的 Agent 和洽机制,只在确切需要判断的方位身手用真实模子。
这有点像 2026 年的一场「代码的文艺恢复」——东谈主们运行再行发现,不是统统「看起来像智能」的问题都应该交给模子来处理。
终态的单干应该是三层:
CLI 层:笃定性彭胀,零 token,可并发,易测试,不依赖任何模子;
Skill 层:盘曲文编排和告诫蒸馏,越用越强;
LLM 层:提供智能,作念确切需要语义判断的部分。
三层不是竞争干系,而是依赖干系。
今天许多系统的问题在于,它们跳过了 CLI 层,径直让 Skill 和 LLM 去兜底。收尾等于:系统又贵又慢,踏实性也差。正确的旅途应该是——确立者预制 CLI,表层欺诈自动管理 Skill,LLM 在 Skill 的扶植下使用 CLI 处理问题。
Hermes 的出现不是很是,而是一个信号:Skill 层的问题可能正在被处理,但下一个确切的战场,在 CLI 层。
Web 端、PC 端、出动端,三大平台系统性的 CLI 检阅才刚刚运行。这可能才是今天 Agent 界限最值得作念、也最不性感找股票配资,但最要害的事情。
实盘交易在炒股配资流程中处于哪一步提示:本文来自互联网,不代表本网站观点。