KTransformers

本地微调

KTransformers 微调把本地可拥有模型的思路从推理延伸到模型适配。如果一台工作站能用 KTransformers 跑起 MoE 模型,那么项目方向就是让同一类机器也能训练这个模型的 LoRA adapter。

系统方向

组件作用
GPUAttention、shared path、剩余 LoRA 计算和分布式训练控制。
CPU expert backend通过 AMX BF16/INT8/INT4 SFT backend 执行大规模 MoE expert 权重。
LLaMA-Factory用户侧训练工作流和数据集/配置管理。
KT 集成use_kt: truekt_config 和 backend-aware expert 执行。

当前公开路径是通过 LLaMA-Factory 运行 LoRA SFT。本页解释技术方向;Fine-Tuning 板块承载可执行的用户文档。