Claude Code Evaluator (cc-eval)

专为 Claude Code 打造的会话质量评分工具，基于 MCP (Model Context Protocol) 协议集成。

通过多维度分析（需求完成度、代码质量、响应时间等），帮助开发者量化评估 AI 编程助手的表现。

功能特性

本工具提供 3 个核心 MCP 工具，模型会根据你的自然语言指令自动调用：

1. evaluate_session (核心)

全方位评估会话表现。

调用示例: "帮我评分", "评估当前会话", "看看这次表现如何"
评分维度: 包含完成度、响应速度、交互效率、代码规模等 6 大维度（详见下文"评分细则"）。

2. list_sessions

列出历史会话，方便查找旧记录。

调用示例: "列出最近的会话", "查看历史记录"

3. get_session_info

查看会话元数据（不执行耗时评分）。

调用示例: "查看这个会话的详情"

评分细则详情

本工具基于 6个核心维度 进行量化评分（采用倒数衰减机制）：

维度	评分逻辑 (倒数计分法)	说明
1. 首次完成度	1.0 或 0.0	仅单轮对话得满分；多轮对话（>1）得0分。
2. 首次响应时间	$1 / \text{分钟数}$	≤1分钟得满分。若首次未完成，此项强制 0分。
3. 总推理时间	$1 / \text{分钟数}$	≤1分钟得满分。计算所有 AI 回复的总耗时。
4. 交互轮数	$1 / \text{次数}$	≤1次得满分。例如：1次=1.0分，2次=0.5分，5次=0.2分。
5. 代码规模	$1 / \text{行数}$	≤1行得满分。鼓励精简代码。例如：10行=0.1分，100行=0.01分。
6. 任务最终完成度	用户打分	用户输入百分比（默认100%）。例如：完成70%，得0.7分。

注：

所有"时间/次数/行数"类指标均采用 倒数衰减 机制，一旦超出基准值，分数会迅速下降。

最终得分：所有 6 个维度的总分 (Sum)。

快速开始

前置要求

Python 3.10 或更高版本
Claude Code CLI

安装配置

在项目根目录下运行以下命令（自动配置绝对路径）：

# 1. 创建虚拟环境并安装依赖
python3 -m venv .venv
./.venv/bin/pip install -r requirements.txt

# 2. 注册 MCP Server (使用当前路径)
claude mcp add cc-eval -- $(pwd)/.venv/bin/python $(pwd)/mcp_server.py

使用指南

配置完成后，在 Claude 的对话框中像与同事交谈一样使用：

你想做什么	你可以说...
评估当前工作	"给这次会话打个分" "评估一下刚才的表现"
查找历史	"列出最近的 5 个会话" "我昨天做了什么？"
指定格式	"用 JSON 格式输出评分报告" "生成 Markdown 格式的评分表"
指定参数	"评估会话 abc-123，完成度70%"

常见问题

Q: "列出最近的会话" 没有反应？ A: 请确保 MCP Server 已正确注册。运行 claude mcp list 查看状态。如果状态正常但无反应，尝试更明确的指令："请调用 list_sessions 工具"。

Q: 评分报告中的"首次完成度"是如何判断的？ A: 如果整个会话只有 1 轮用户提示词，则判定为首次完成（满分）；如果有多轮对话（>1 轮），则判定为首次未完成（0分）。你可以通过参数 first_completed=true/false 手动覆盖此判断。

Q: 如何查看工具的运行日志？ A: 日志保存在项目目录下的 cc_eval.log 文件中。

项目结构

.
├── mcp_server.py           # MCP Server 入口 (FastMCP)
├── cc_evaluator/           # 评分核心逻辑
│   ├── evaluators/         # 评分器 (时间、代码、交互等)
│   ├── parser/             # 日志解析器
│   └── reporter/           # 报告生成器
├── requirements.txt        # 项目依赖
├── ARCHITECTURE.md         # 架构设计文档
└── cc_eval.log             # 运行日志

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
cc_evaluator		cc_evaluator
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
README.md		README.md
cc_eval.py		cc_eval.py
mcp_server.py		mcp_server.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Claude Code Evaluator (cc-eval)

功能特性

1. evaluate_session (核心)

2. list_sessions

3. get_session_info

评分细则详情

快速开始

前置要求

安装配置

使用指南

常见问题

项目结构

About

Uh oh!

Releases

Packages

Languages

franklwy/ClaudeCodeEvaluator

Folders and files

Latest commit

History

Repository files navigation

Claude Code Evaluator (cc-eval)

功能特性

1. evaluate_session (核心)

2. list_sessions

3. get_session_info

评分细则详情

快速开始

前置要求

安装配置

使用指南

常见问题

项目结构

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages