本地微调

KTransformers 微调把本地可拥有模型的思路从推理延伸到模型适配。如果一台工作站能用 KTransformers 跑起 MoE 模型，那么项目方向就是让同一类机器也能训练这个模型的 LoRA adapter。

系统方向

组件	作用
GPU	Attention、shared path、剩余 LoRA 计算和分布式训练控制。
CPU expert backend	通过 AMX BF16/INT8/INT4 SFT backend 执行大规模 MoE expert 权重。
LLaMA-Factory	用户侧训练工作流和数据集/配置管理。
KT 集成	`use_kt: true`、`kt_config` 和 backend-aware expert 执行。

当前公开路径是通过 LLaMA-Factory 运行 LoRA SFT。本页解释技术方向；Fine-Tuning 板块承载可执行的用户文档。