大模型微调入门:从全量微调到 LoRA 和 QLoRA —— 一个工程师的实战笔记

从全量微调的昂贵代价,到 LoRA 的轻量适配,再到 QLoRA 在 48GB 显存上微调 65B ...

读出全部

我在实战中理解 LoRA:为什么它让我从‘参数焦虑’中解脱

记录我从完全不懂到亲手用 LoRA 微调 GPT-2 的全过程,揭开低秩适配如何在不牺牲性能的前提下...

读出全部

FFN 与 SwiGLU 解析

写在前面 在之前的系列文章中,我们从 Tokenizer 讲到 Embedding 再到 RoPE,...

读出全部

PEFT 深度解析:如何用几MB的参数微调百亿级大模型

本文深入剖析PEFT(参数高效微调)的核心机制,解释LoRA如何通过低秩分解在冻结主模型的前提下实现...

读出全部

RAG 相关技术:从检索增强到可控知识注入

一篇关于 RAG 的学习笔记:RAG 不是把向量数据库接到模型前面那么简单,而是一条从知识组织、召回...

读出全部