📦 Unit Test Quality Checker — 单元测试质量检查器

v1.0.0

评估测试套件以满足严格的单元测试标准，分类测试类型，并在假对象和模拟对象之间选择。每当开发人员问“是否…”时使用。

0· 0·0 当前·0 累计

by @quochungto (Hung Quoc To)·CC-BY-SA

开发工具代码生成测试工具 AI模型访问系统工具

下载技能包

License

CC-BY-SA

License

CC-BY-SA

请查看许可证条款了解详情。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install bookforge-unit-test-quality-checker

镜像加速npx clawhub@latest install bookforge-unit-test-quality-checker --registry https://cn.longxiaskill.com✓ 镜像可用

需要定制？告诉我你的需求 →

技能文档

单元测试质量检查器评估现有的测试是否符合Feathers的标准，按类型分类每个测试，评估测试双精选，并生成带有优先改进计划的评分质量报告。何时使用使用此技能时：测试套件运行缓慢，需要了解原因正在审计遗留代码库的测试覆盖质量团队正在辩论他们的“单元测试”是否真正是单元测试有人问“这里应该使用模拟还是伪造？” 测试不稳定，难以在本地运行，或者需要环境设置才能运行不要使用此技能来从头写新的测试。对于写入特征测试，使用characterization-test-writing。对于打破使测试变慢的依赖，使用dependency-breaking-technique-executor。背景和输入收集在开始之前，确认：测试文件路径或目录 - 测试文件存放在哪里？（test/、src/test/、spec/等）语言和测试框架 - JUnit、pytest、NUnit、RSpec、Vitest、Go testing等测试是否可以运行？ - 是否可以使用Bash访问运行整个套件或单个文件并测量时间？是否有已知的测试双精选？ - 代码库中是否有现有的伪造、模拟、存根或间谍？如果用户无法运行测试，时间分析将是静态的（基于模式）。在报告中明确标记。过程步骤1：测试库存使用Glob和Grep枚举测试文件并计算单个测试用例。 Glob：test/*/.{java,py,ts,js,rb,cs,go}（适应语言） Grep：测试方法/函数声明的模式记录：总测试数、检测到的测试框架、测试文件结构。原因：您无法对无法看到的测试进行分类。计数还显示测试套件是否处于一个规模，使得慢速测试会导致构建延迟数分钟。步骤2：应用四个排除标准对于每个测试文件，使用Grep查找模式以表明不符合单元测试标准。四个排除标准 - 测试不是单元测试如果：与数据库交谈跨网络进行通信触摸文件系统需要特殊环境设置才能运行（编辑配置文件、设置环境变量、启动服务） Grep模式（适应语言）：排除标准搜索模式数据库 DataSource、EntityManager、@Repository、sqlite3、psycopg2、mongoose、ActiveRecord、db.execute、cursor.execute 网络 HttpClient、requests.get、fetch(、RestTemplate、socket.、urllib、axios、WebClient 文件系统 File(、open(、fs.readFile、FileInputStream、Path.of、os.path、tmpfile、shutil 环境设置 System.getenv、os.environ、process.env、dotenv、application.properties在测试级别加载、@SpringBootTest、@IntegrationTest 对于每个标记的测试，记录：文件、测试名称、排除标准类型、行引用。原因：这四个排除标准是具体的和可检查的。测试可以在逻辑上很小，但仍然违反所有四个。排除标准是Feathers定义与非正式的“小测试”含义之间的区别所在 - 排除标准存在是因为DB/网络/FS/环境依赖使测试变慢、不稳定且无法定位故障。步骤3：测量时间如果Bash访问可用，运行测试套件（或代表性子集）并测量每个测试的时间。 JUnit / Maven mvn test -pl module 2>&1 | grep "Tests run" pytest pytest --tb=no -q --durations=20 Jest npx jest --verbose --testPathPattern="..." Go go test ./... -v -timeout 60s 2>&1 | grep -E "^--- (PASS|FAIL)" 阈值：任何单个测试超过1/10秒（100ms）都是慢速单元测试。这是定义，而不是指南。一个需要1/10秒才能运行的测试就是一个慢速单元测试。标记每个超过100ms的测试。对于总时间超过60秒的套件，标记最慢的10个测试作为优先目标。原因：速度不是一个很好的质量 - 它是定义性的。一个慢速的测试套件停止给开发人员快速的反馈。当测试需要数分钟时，开发人员停止运行它们。整个反馈循环都被打破了。步骤4：分类每个测试使用排除结果和时间数据，将每个测试分类为三个类别之一：单元测试：通过所有四个排除标准且运行时间少于100ms。故障点指向特定的小范围代码。更高级别的测试：故意覆盖多个类或组件之间的交互。可能会跨越边界（DB、网络、FS）以设计。较慢。用于在单元测试难以编写时确定集成行为。这些是合法的 - 不要要求它们满足单元测试标准。它们服务于不同的目的。特征测试：编写用于记录当前实际行为，而不是证明正确性。通常在遗留代码库中作为重构前的安全网。关键标记：断言匹配代码当前的行为（可能包括错误），而不是它应该做的。目的：在附近的代码更改时保持行为稳定。合法类别 - 不要将其重新分类为错误。边缘/不明确：测试不明确或不符合上述类别。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库