2026 年 – 第 2 页 – 博瑾狐的小窝

在

码途随笔

注意力即一切：从 MHA 到 GQA

2026年4月28日
540 words

写在前面终于，我们来到了 Transformer 最核心、最“灵魂”的部分——Attention（...

在

码途随笔

大模型微调入门：从全量微调到 LoRA 和 QLoRA —— 一个工程师的实战笔记

2026年4月27日
236 words

从全量微调的昂贵代价，到 LoRA 的轻量适配，再到 QLoRA 在 48GB 显存上微调 65B ...

在

码途随笔

我在实战中理解 LoRA：为什么它让我从‘参数焦虑’中解脱

2026年4月27日
266 words

记录我从完全不懂到亲手用 LoRA 微调 GPT-2 的全过程，揭开低秩适配如何在不牺牲性能的前提下...

在

码途随笔

FFN 与 SwiGLU 解析

2026年4月27日
568 words

写在前面在之前的系列文章中，我们从 Tokenizer 讲到 Embedding 再到 RoPE，...

在

码途随笔

PEFT 深度解析：如何用几MB的参数微调百亿级大模型

2026年4月27日
171 words

本文深入剖析PEFT（参数高效微调）的核心机制，解释LoRA如何通过低秩分解在冻结主模型的前提下实现...

在

码途随笔

RAG 相关技术：从检索增强到可控知识注入

2026年4月27日
93 words

一篇关于 RAG 的学习笔记：RAG 不是把向量数据库接到模型前面那么简单，而是一条从知识组织、召回...

在

码途随笔

Harness 工程：把 AI Agent 放进可验证的工作回路

2026年4月26日
69 words

一篇关于 harness 工程的学习笔记：它不是单纯的测试脚本，而是把任务、工具、评估、反馈和人工控...

在

码途随笔

Embedding 与 RoPE 解析

2026年4月26日
354 words

写在前面在前两篇文章中，我们分别拆解了 LLM 的整体架构，又专门深挖了 Tokenizer。现在...

在

码途随笔

Tokenizer 解析

2026年4月25日
341 words

写在前面在上一篇文章中，完整地走了一遍 LLM 的架构全景图。那篇文章提到：原始文本进入模型的第一...

在

码途随笔

从零开始，搞懂大语言模型的“五脏六腑”——LLM架构全景解析

2026年4月24日
484 words

写在前面 AI无疑是最近几年最火的东西了，其能力与发展速度都让人惊叹，从17年的Transforme...

博瑾狐的小窝