LLM Evaluation – 博瑾狐的小窝

在

码途随笔

Harness 工程：把 AI Agent 放进可验证的工作回路

2026年4月26日
69 words

一篇关于 harness 工程的学习笔记：它不是单纯的测试脚本，而是把任务、工具、评估、反馈和人工控...