跳至内容

博瑾狐的小窝

tech life love

×
  • 朝花夕拾
  • 码途随笔
  • 项目札记
  • 关于我的小窝

标签: LLM Evaluation

  1. 首页
在
  • 码途随笔

Harness 工程:把 AI Agent 放进可验证的工作回路

  • 2026年4月26日
  • 69 words

一篇关于 harness 工程的学习笔记:它不是单纯的测试脚本,而是把任务、工具、评估、反馈和人工控...

  • AI Agent
  • Claude
  • Harness Engineering
  • LLM Evaluation
  • OpenAI Evals
读出全部
modern developer at desk with AI coding assistant floating above screen
在
  • 码途随笔

Claude Code使用指南:提升开发效率的AI编码助手

  • 2026年5月15日
  • 467 words
  • AI编程
  • Claude Code
  • VS Code
  • 代码生成
  • 开发效率
在
  • 码途随笔

Agent流程编排技术详解:构建高效智能工作流

  • 2026年5月15日
  • 530 words
  • AI代理
  • 大模型应用
  • 智能系统
  • 流程编排
  • 自动化

博瑾狐

一个活着的人

modern developer at desk with AI coding assistant floating above screen

Claude Code使用指南:提升开发效率的AI编码助手

  • 2026年5月15日
  • 467 words

Agent流程编排技术详解:构建高效智能工作流

  • 2026年5月15日
  • 530 words

Yarn上下文扩展技术深度解析:原理、实现与实战

  • 2026年5月13日
  • 388 words

自豪地采用 WordPress | postmagthemes.com | 主题详情 | Context Blog