流程:用户请求 → agent → 工具调用前分类器 → 执行 → 工具结果经注入探针 → 返回…
🔥CodeAgent和Skills、Plugins等相关组件的开源项目
https://github.com/trending?since=weekly 1 Agent管理 Agen…
Langfuse-开源 LLM engineering / LLMOps 平台
介绍 Langfuse 是一个开源 LLM engineering / LLMOps 平台,核心定位不是 “a…
andrej-karpathy-skills
andrej-karpathy-skills 是由 Multica 团队开发的开源项目,核心是将 AI 大牛 …
github最近热点项目查看
https://github.com/trending?since=weekly
本地管理agent/skills工具
Skills-manage 地址:https://github.com/iamzhihuix/s…
Skills接受一个json数据
上游调用这个skill传递json,当前skill如何接受这个json的数据呢? [crayon-6a2af3…
基于大语言模型的 Google 集成测试失败自动诊断
原文《LLM-Based Automated Diagnosis Of Integration Test Fa…
Claude Code 在大型代码库中的实践:核心原理、最佳实践与落地路径
原文:How Claude Code works in large codebases: Bes…
Agentic Search (Claude Code 原生)
一、定义 Agentic Search = 智能体自主决策式代码检索 区别传统静态 RAG 向量检索,是大模型…
LLM Wiki 体系
是Andrej Karpathy 提出的用大模型搭建个人 / 团队持久化知识库的全新范式,核心是…
Ground Truth 评测概念
Ground Truth(真值 / 基准标准答案),就是评测时的绝对正确标准答案、真实事实、参照基准。 一、介…
AGENTS.md介绍
AGENTS.md 源于 Anthropic 的 CLAUDE.md 实践,2025 年 5 月由 Open…
编程规范:agents.md vs skill
结论:通用的开发规范定义成skills,项目独有开发规范定义在agents.md 一、核心分层规…
evaluating-skills 评测Skills输出质量
如何通过评估驱动的迭代,测试你的Skills是否能稳定生成优质输出。 你写完一个技能,用一条提示词跑通了,但它…
