基于 LoRA_Demo 项目的可复现链路:1000 条 JSONL → 单卡 SFT → verify_lora → vLLM 动态 LoRA API

阅读建议

  1. 第 1–2 篇(开篇与数据):场景选型、JSONL 与心理模型
  2. 第 3–4 篇(原理与环境):LoRA 参数、ModelScope 与 GPU 分工
  3. 第 5–6 篇(训练代码):train_lora_single.py 逐步讲解
  4. 第 7–8 篇(指标与验证):all_logs 复盘、Mac MPS 实测
  5. 第 9–10 篇(踩坑与部署):Qwen3.5 thinking、vLLM serve

文章列表

标题 阶段
01 为什么用 LoRA 做老年情感陪伴 AI 开篇
02 训练集设计:1000 条 JSONL 与老年心理模型 数据
03 LoRA 原理:只训 0.25% 参数 原理
04 Qwen3.5-4B LoRA 微调环境搭建与模型准备 环境
05 单卡 SFT 实战(上):Tokenizer、基座与 LoRA 配置 训练
06 单卡 SFT 实战(下):SFTTrainer 与训练循环 训练
07 读懂 LoRA 训练曲线:750 step 实盘复盘 指标
08 LoRA 效果验证:verify_lora.py 原理与 Mac 实测 验证
09 Qwen3.5 踩坑:thinking 链与 flash-attn 踩坑
10 vLLM 部署:动态挂载 LoRA 与 OpenAI 兼容 API 部署