基于 LoRA_Demo 项目的可复现链路:1000 条 JSONL → 单卡 SFT → verify_lora → vLLM 动态 LoRA API。
阅读建议
- 第 1–2 篇(开篇与数据):场景选型、JSONL 与心理模型
- 第 3–4 篇(原理与环境):LoRA 参数、ModelScope 与 GPU 分工
- 第 5–6 篇(训练代码):train_lora_single.py 逐步讲解
- 第 7–8 篇(指标与验证):all_logs 复盘、Mac MPS 实测
- 第 9–10 篇(踩坑与部署):Qwen3.5 thinking、vLLM serve
文章列表
| 篇 | 标题 | 阶段 |
|---|---|---|
| 01 | 为什么用 LoRA 做老年情感陪伴 AI | 开篇 |
| 02 | 训练集设计:1000 条 JSONL 与老年心理模型 | 数据 |
| 03 | LoRA 原理:只训 0.25% 参数 | 原理 |
| 04 | Qwen3.5-4B LoRA 微调环境搭建与模型准备 | 环境 |
| 05 | 单卡 SFT 实战(上):Tokenizer、基座与 LoRA 配置 | 训练 |
| 06 | 单卡 SFT 实战(下):SFTTrainer 与训练循环 | 训练 |
| 07 | 读懂 LoRA 训练曲线:750 step 实盘复盘 | 指标 |
| 08 | LoRA 效果验证:verify_lora.py 原理与 Mac 实测 | 验证 |
| 09 | Qwen3.5 踩坑:thinking 链与 flash-attn | 踩坑 |
| 10 | vLLM 部署:动态挂载 LoRA 与 OpenAI 兼容 API | 部署 |