第06课 认识 Agent Skill

    • 主讲:Bensz Conan
    • 日期:2026-02-17

    课程内容

    • Prompt / Agent / Tools / MCP / Skill 各自解决什么问题
    • 为什么 Prompt 工程会自然演化到“可复用工作流”
    • 可落地的 Skill 骨架与工程化 checklist
    • 实战

    术语速览

    • Prompt:你给模型的意图与约束(自然语言接口)
    • Tool:模型能调用的外部动作(函数/命令/接口)
    • Agent:会规划、会调用工具、会迭代修正的执行体
    • MCP:标准化、安全地把外部工具/资源接入模型的“连接层”
    • Skill:把流程与标准沉淀成可复用、可部署的“流程层资产”

    Prompt 的演化

    第一阶段:in-context learning

    • 方法:给几个示例,让模型模仿
    • 代表:GPT-3 的 few-shot 能力把 in-context learning 带入大众视野
    • 局限:强依赖示例质量;难表达复杂流程与边界

    第二阶段:CoT(Chain-of-Thought)

    • 核心:让模型把“推理过程”显式写出来
    • 价值:多步骤任务(数学/推理/规划)更稳、更可控
    • 变化:Prompt 从“答案”转向“步骤”

    第三阶段:ReAct(Reason + Act)

    • 核心:把“思考”与“行动(工具调用)”串起来
    • 价值:会查资料、会验证、会迭代修正
    • 变化:Prompt 从“步骤”转向“闭环流程”

    第四阶段:Tools / Functions 成为标配

    • 目标:让模型稳定地产生结构化输出并触发外部工具
    • 结果:Prompt 不只是写一段文本,而是驱动一个工作流
    • 代表思路:Toolformer 把“用工具”当作可学习能力

    第五阶段:Agents → Skill(工程化资产)

    • 当 Prompt 变成流程:你需要版本、测试、复用、部署
    • 结论:把“会话技巧”做成“技能资产”更可靠、更可协作

    粗粒度时间线(5 阶段)

    阶段关键词Prompt 的变化典型结果形态
    in-context learningfew-shot给例子让它模仿一次性生成
    推理提示CoT让它按步骤想多步推理文本
    行动提示ReAct想 + 用工具 + 再想工具调用 + 迭代
    工作流化Agents/Tools把任务拆成可重复跑的流程脚本/配置/结构化输出
    工程化资产Agent Skill把流程沉淀成可部署的技能包SKILL.md + scripts + config

    Agent Skill

    Skill 不是“更复杂的 Prompt”

    • Prompt 更像“现场口头交代”:灵活,但易漂移、难复现
    • Skill 更像“可执行剧本”:流程、标准、边界与验收一起交付
    • 关键词:可维护、可复现、可协作、可迭代
    • Skill 的本质: 把 Prompt + 规则 + 脚本 + 模板打包成工程资产,让 AI 从“聊天”走向“稳定交付”

    Skill 的最小目录骨架

    my-skill/
    ├── SKILL.md          # 语义接口 + 工作流(给 AI 读的“剧本”)
    ├── config.yaml       # 参数与硬约束(把不确定性关进笼子)
    ├── scripts/          # 确定性执行(能跑就别让模型背)
    └── references/       # 需要时再加载(规范/模板/示例/FAQ)
     

    四件套分工

    • SKILL.md:意图、步骤、写作/编码标准、验收方式(偏语义)
    • config.yaml:硬参数、禁止项、阈值、统一口径(偏确定)
    • scripts/:改文件、跑命令、抓数据等确定性动作(偏执行)
    • references/:只在需要时加载的资料(偏知识库)

    我的经验:模糊端 / 精确端分离

    • 模糊端:需要语义理解与创造力(结构、叙事、取舍)
    • 精确端:必须可复现、不可乱改(阈值、格式、替换规则)

    MCP与Skill的联系

    MCP 解决什么问题

    • 目标:让模型安全、标准化地访问外部工具与资源
    • 场景:GitHub、数据库、文件系统、搜索、Notion、内部服务……
    • 关键词:连接、权限、标准协议、可组合

    Skill 解决什么问题

    • 目标:告诉 AI “什么时候做什么、按什么顺序、做到什么标准”
    • 本质:把流程与验收写进系统,而不是写进一次性对话
    • 一句话对比
      • MCP:把外部世界接进来(能拿到数据、能做动作)
      • Skill:把工作流定下来(知道怎么做、如何验收)

    MCP 与 Skill 如何协作

    层级弹钢琴类比AI 生态角色核心职责
    目标层想弹奏一首曲子你要完成的任务定义"做什么"
    流程层乐谱(规定指法、节奏、强弱)Skill定义"怎么做、做到什么程度"
    连接层手指与琴键的配合机制MCP把工具/资源安全接进来
    资源层钢琴(琴弦、音板、踏板)Tools / ResourcesGitHub / 文件系统 / 搜索 / DB

    实战1:拆解一个标准的 Agent skill

    关注 huangwb8/skills 项目

    • 从我的skills项目开始: huangwb8/skills - Github
    • 安装该项目

    实战2:安装和使用 Agent skill

    使用 git-commit skill 提交一些更改

    • Claude Code
    /git-commit
     
    • Codex
    [$git-commit](/Users/bensz/.codex/skills/git-commit/SKILL.md) 
     

    小结

    Agent Skill 架构回顾

    任务目标
        ↓
    Skill(流程层:步骤 / 标准 / 约束 / 验收)
        ↓
    MCP(连接层:安全接入外部工具与资源)
        ↓
    Tools / Resources(GitHub / 文件系统 / 搜索 / DB / ...)
     

    关键要点总结

    • Prompt 的演化路径:从 few-shot → CoT → ReAct → Tools → Skill,核心趋势是"从对话到稳定交付"
    • Skill 的本质:把 Prompt + 规则 + 脚本 + 模板打包成工程资产,让 AI 从"聊天"走向"可复现交付"
    • MCP 与 Skill 分工:MCP 是连接层(把外部世界接进来),Skill 是流程层(把工作流定下来)
    • 四件套设计原则:SKILL.md(语义)、config.yaml(约束)、scripts/(执行)、references/(知识库)
    • 模糊端与精确端分离:让 AI 做"内容与结构",不让 AI 做"危险操作"
    单位 Logo