KTransformers

KTransformers 文档

KTransformers 是一个面向大型 MoE 模型的 CPU-GPU 异构计算项目,覆盖推理服务和 LoRA 微调。文档按任务优先组织:先选择正确包路径,再进入推理或微调,跑通模型后再看模型教程、技术背景、硬件边界和命令参考。

当前公开入口

任务公开包组合主要入口
推理服务kt-kernel sglang-ktkt run 或带 --kt-* 参数的 python -m sglang.launch_server
LoRA SFT通过 LLaMA-Factory 使用 ktransformers[sft]use_kt: true 的 LLaMA-Factory training YAML 和 Accelerate KT 配置

local_chat.pyktransformers/server/main.pybalance_servekt_optimize_rule 路径属于历史入口,除非页面明确说明已经重新验证,否则不作为当前主线。

快速开始

推理

微调

高级功能

支持模型与硬件

技术工作

开发者与命令参考