KTransformers

安装指南

KTransformers 当前公开包入口分成两条路径。先根据任务选择对应安装方式。

任务包组合适用场景
推理kt-kernel sglang-ktkt run 或 SGLang-KT 启动模型服务。
微调ktransformers[sft]通过 LLaMA-Factory 运行 MoE LoRA SFT。

推理安装

pip install kt-kernel sglang-kt

kt-kernel 提供 KT MoE expert backend。sglang-kt 提供当前 KTransformers 推理文档使用的 SGLang serving 路径。

验证命令行工具:

kt version
kt doctor

然后继续阅读首次启动推理服务

微调安装

LLaMA-Factory SFT 推荐流程:

cd /path/to/LLaMA-Factory
pip install -e .
pip install -r requirements/ktransformers.txt

requirements/ktransformers.txt 应包含公开 KT SFT 入口:

ktransformers[sft]

这会安装 ktransformers 及其 SFT 依赖,包括 kt-kerneltransformers-ktaccelerate-kt。它不会安装 sglang-kt,因为 sglang-kt 只属于推理路径。

然后继续阅读首次运行 LoRA SFT

运行模型前

把具体模型教程当成当前支持前,请先查看支持矩阵。旧页面可能仍为追溯保留,但旧 local_chat.pyktransformers/server/main.pybalance_servekt_optimize_rule 路径都属于 legacy,除非页面已经明确重写。

后续常用页面: