是Andrej Karpathy 提出的用大模型搭建个人 / 团队持久化知识库的全新范式,核心是…
Ground Truth 评测概念
Ground Truth(真值 / 基准标准答案),就是评测时的绝对正确标准答案、真实事实、参照基准。 一、介…
AGENTS.md介绍
AGENTS.md 源于 Anthropic 的 CLAUDE.md 实践,2025 年 5 月由 Open…
编程规范:agents.md vs skill
结论:通用的开发规范定义成skills,项目独有开发规范定义在agents.md 一、核心分层规…
evaluating-skills 评测Skills输出质量
如何通过评估驱动的迭代,测试你的Skills是否能稳定生成优质输出。 你写完一个技能,用一条提示词跑通了,但它…
【Vercel Skills】Find Skill
作用:Agent 技能检索 & 安装辅助能力 注意:find-skill,只是安装检索到skill,如…
CLI-Anything介绍:一行命令,让所有软件成为 AI Agent 原生工具
由 香港大学数据科学实验室(HKUDS) 开源,一行命令把任意软件变成 AI Agent 原生可调用的 CLI…
Skill.md最佳实践模版
参考: 创建Skills最佳实践 技能创建核心原则 1. 从真实专业知识出发 核心:注入领域专属上下文,避免依…
创建Skills最佳实践
原文:Best practices for skill creators 一、如何编写范围合理、适配任务的技能…
Claude加载机制&&1个skill按经验是多少个token
一、经验值 按经验值估算:1个skill包含400个字符,100个token 字符和token关系:1个tok…
Claude Code源码链接收藏
https://github.com/instructkr/claw-code ⭐️ 104k …
【Plugin】Presets预设配置包&Market/Plugin
如何使用?Agent在处理任务时根据preset定义的role来选择可用的skill,不是来找这个plugin…
Harness理解:搭建验证反馈链路
Harness Engineering 的底层本质,就是「给代码变更加上一条的验证反馈链路」,即验证-反馈给a…
【Harness】面向长时运行应用开发的Harness框架设计
原文链接:https://www.anthropic.com/engineering/harness-desi…
🔥【Claude Code Plugin】Plugin和Skill汇总
社区 🔥Claude Code Skills社区 everything-claude-code 🔥🔥【Clau…
