通过 LLaMA-Factory 运行 LoRA SFT

KTransformers 微调由 LLaMA-Factory 驱动。先安装 LLaMA-Factory，再从它的 KT requirements 安装 KT SFT extra：

cd /path/to/LLaMA-Factory
pip install -e .
pip install -r requirements/ktransformers.txt

KT requirements 文件包含：

ktransformers[sft]

安装内容

ktransformers[sft] 会带入 KT SFT 栈：

包	作用
`ktransformers`	面向用户的包和 KT 集成。
`kt-kernel`	CPU expert kernel 和 SFT backend 实现。
`transformers-kt`	KT 兼容的 Transformers 集成。
`accelerate-kt`	支持 KT 配置的 Accelerate 集成。

它不会安装 sglang-kt；sglang-kt 属于推理服务路径。

示例目录

当前 examples 位于 LLaMA-Factory 的 examples/ktransformers/：

examples/ktransformers/train_lora/*.yaml
examples/ktransformers/accelerate/fsdp2_kt_*.yaml

Training YAML 通过下面字段启用 KT：

use_kt: true

Accelerate config 通过下面字段选择 KT backend：

kt_config:
  enabled: true
  kt_backend: AMXBF16

启动形态

从 LLaMA-Factory KT examples 开始：

CUDA_VISIBLE_DEVICES=0,1,2,3 accelerate launch \
  --config_file examples/ktransformers/accelerate/fsdp2_kt_int8.yaml \
  src/train.py \
  examples/ktransformers/train_lora/qwen3_5moe_lora_sft_kt.yaml

训练全局 mixed precision 和 KT backend 名称是两件事。当前 examples 通常使用 BF16 训练，同时通过 kt_config 选择 KT expert backend。

把示例用于自己的生产环境前，建议记录模型、checkpoint、包版本、硬件、完整命令和前几个 training steps，并先做短步数 smoke。