博瑾狐的小窝 – tech life love

关于我的小窝

2026年4月14日

Hello World! 这是用来记录自己学习工作的博客站，也会在这里更新我的日常生活（作为我的树洞）。

modern developer at desk with AI coding assistant floating above screen

在

码途随笔

Claude Code使用指南：提升开发效率的AI编码助手

2026年5月15日
467 words

为什么开发者需要Claude Code？AI编码助手的崛起随着AI技术在开发工具中的深度集成，Cl...

在

码途随笔

Agent流程编排技术详解：构建高效智能工作流

2026年5月15日
530 words

什么是Agent流程编排？为何它正在重塑AI应用架构在上一节中，我们探讨了智能代理（Agent）的...

在

码途随笔

Yarn上下文扩展技术深度解析：原理、实现与实战

2026年5月13日
388 words

引言：为什么Yarn需要上下文扩展？在上一节中，我们探讨了Yarn插件系统的整体演化路径，而要真正...

在

码途随笔

QLoRA微调原理详解：与LoRA的性能与内存对比

2026年5月13日
448 words

引言：为什么大模型微调需要QLoRA？在深入LoRA微调机制之前，我们必须直面一个现实：当今主流大...

在

码途随笔

关于Norm的解析

2026年5月4日
434 words

可以说，如果没有残差连接和 Layer Normalization（层归一化）这样一刚一柔的黄金组合...

在

码途随笔

从 SGD 到 AdamW 的优化器

2026年5月3日
397 words

写在前面在上一篇文章中，我们讨论了如何用数据并行、张量并行和流水线并行，把一个大模型“拆开”放到成...

在

码途随笔

数据并行、张量并行和流水线并行解析

2026年5月2日
231 words

写在前面目前为止的文章都在聊一件事：单个模型内部的“微观世界” ——Embedding怎么工作、A...

在

码途随笔

MoE架构解析

2026年5月1日
199 words

如果说我们之前拆解的所有Transformer组件——从FFN到Attention——都是为了让单个...

在

码途随笔

从“重复劳动”到“智能记忆”：KV Cache与PagedAttention深度解析

2026年4月30日
361 words

写在前面在前面的六篇文章中，我们完整拆解了Transformer的静态架构——从Tokenizer...

在

码途随笔

残差连接、Pre-Norm与Post-Norm

2026年4月29日
234 words

写在前面在前几篇文章中，我们像拆解一个精密的机械表一样，一步步解剖了 LLM 的各个核心组件：从 ...