0%

前言:什么是 BMAD-METHOD? bmad-code-org/BMAD-METHOD (Breakthrough Method for Agile Ai Driven Development) 是一套AI 驱动的敏捷开发方法论和框架。 核心理念:它不仅仅是让 AI 写代码,而是将 AI 角色化(Context Engineering)。它在IDE中构建了一个“虚拟软件开发团队”,包括: * Analyst (分析师):负责创意和需求分析。 * PM (产品经理):负责撰写 PRD(产品需求文档)。 * Architect (架构师):负责技术选型和系统设计。 * Scrum
Read more »

1个月前(2025年10月15日),LangChain的工程师Lance Martin和Manus的联合创始人Peak(季逸超)有一个关于上下文工程的网络研讨,录屏在这里;潘锦有一篇非常好的笔记,在这里。 这里将基于Youtube的视频录屏和潘锦的笔记,融合学习记录一下。 前言 当大模型厂商竞相宣扬 100万 甚至 200万 Token 的超长上下文窗口时,身处生产一线的工程师们却发现了一个残酷的现实:“能放得下”并不等于“能处理好”。 在构建复杂 AI Agent(智能体)的过程中,上下文不仅是信息的容器,更是成本、延迟与智能水平的制约瓶颈。Lance和Pete的对话揭示了当前 AI 顶
Read more »

随着引入 Skills(技能),越来越多人对 Claude 的“智能体 (agentic) 生态系统”中各个组件如何协作很感兴趣。无论你是在构建 Claude Code 的复杂工作流、用 API 打造企业解决方案,还是在 Claude.ai 上最大化个人效率,知道什么时候该用什么工具都会极大地改变你与 Claude 的协作方式。 本指南将分解每个构建模块 (building block),解释何时使用,以及如何将它们组合起来,形成强大的代理工作流。 理解智能体的构建模块 (agentic building blocks) 什么是 Skills? * Skills 是一个 文件夹,里面包含
Read more »

引言:从实例分割到概念分割的演进 在多模态人工智能(AI)领域,对视觉场景进行精确的查找与分割是一项基础性能力,它为机器人技术、内容创作、增强现实、数据标注乃至更广泛的科学研究等应用提供了核心支持。SAM(Segment Anything Model)系列模型通过引入可提示视觉分割(Promptable Visual Segmentation, PVS)任务,在图像和视频分割领域取得了重大突破。这些模型能够根据点、框或掩码等提示,精确分割出单个目标对象。然而,这一范式也存在其固有的局限性:每次提示仅能处理一个对象,无法应对更普遍的“概念级”分割需求,例如,一次性找出并分割出图像中“所有的鱼”,
Read more »

Authentik是目前在自托管领域非常受欢迎的开源身份认证与授权系统,它是很多现代应用(包括FastAPI、Vue、Kubernetes Dashboard、Grafana 等)常用的统一身份认证(SSO)解决方案。 它可以实现的主要功能清单如下: 类别功能描述🧑 用户管理用户注册、密码找回、邮箱验证、分组、属性扩展🔐 登录方式用户名+密码、MFA(TOTP、短信、WebAuthn)、社交登录🔄 单点登录 (SSO)完整支持 OIDC、OAuth2、SAML 2.0🎟️ 授权内置 RBAC(角色、组、策略),支持自定义规则(Python 表达式)🧾 应用管理可以为任意外部应用注册
Read more »

第一步:构建底层数据“仓库” 一切的基础是数据表结构。我们需要设计能兼容“绘图模型(重图片)”和“文本模型(重逻辑)”的通用字段。 1. 新建多维表格:在飞书云文档新建空白多维表格,命名为“Prompt资产库”。 2. 配置关键字段(建议按以下顺序排列): * Prompt 标题(文本):简短描述,如“赛博朋克风街道”、“小红书爆款文案生成”。 * Prompt 正文(文本):核心字段。建议开启“富文本”模式,以便对关键词进行加粗或换行排版。 * 效果缩略图(附件):核心字段。上传Midjourney生成的图片,或ChatGPT对话的精彩截图。 * 适用模型(单选):设置选项为
Read more »

Langfuse是一个开源的LLM工程平台/可观测 (observability) 工具,旨在帮助开发、监控、评估、调试基于大语言模型 (LLM) 的应用。本文将从0经验开始试用下Langfuse,看看它有哪些功能及其效果。 安装部署 可以直接注册个Langfuse Cloud账号来体验,也可以自部署,这里采用docker进行自部署: 1 2 3 git clone https://github.com/langfuse/langfuse.git cd langfuse docker compose up 顺利启动后,可以通过http://localhost:3000来访问。
Read more »

v4: Skills 机制 核心洞察:Skills 是知识包,不是工具。 知识外化:从训练到编辑的范式转变 Skills 机制体现了一个深刻的范式转变:知识外化 (Knowledge Externalization)。 传统方式:知识内化于参数 传统 AI 系统的知识都藏在模型参数里。你没法访问、没法修改、没法复用。 想让模型学会新技能?你需要: 1. 收集大量训练数据 2. 设置分布式训练集群 3. 进行复杂的参数微调(LoRA、全量微调等) 4. 部署新模型版本 这就像大脑突然失忆,但你没有任何笔记可以恢复记忆。知识被锁死在神经网络的权重矩阵中,对用户完全不透明。 新范
Read more »

v3: 子代理机制 ~450 行代码,+1 个工具,分而治之。 v2 添加了规划。但对于大型任务如”探索代码库然后重构认证”,单一 Agent 会撞上上下文限制。探索过程把 20 个文件倒进历史记录,重构时失去焦点。 v3 添加了 Task 工具:生成带有隔离上下文的子代理。 问题 单 Agent 的上下文污染: 1 2 3 4 5 主 Agent 历史: [探索中...] cat file1.py -> 500 行 [探索中...] cat file2.py -> 300 行 ... 15 个文件 ... [现在重构...] "等等,file1 里有什么来着?"
Read more »

v2: 结构化规划与 Todo ~300 行代码,+1 个工具,显式任务追踪。 v1 能工作。但对于复杂任务,模型会失去方向。 让它”重构认证、添加测试、更新文档”,看看会发生什么。没有显式规划,它在任务间跳跃、忘记步骤、失去焦点。 v2 只添加一样东西:Todo 工具。约 100 行新代码,根本性地改变了 Agent 的工作方式。 问题 在 v1 中,计划只存在于模型的”脑中”: 1 2 v1:"我先做 A,再做 B,然后 C"(不可见) 10 次工具调用后:"等等,我在干什么?" Todo 工具让它显式化: 1 2 3 4 v2: [ ] 重构认证模块
Read more »