KTransformers

CLI 参考

kt 命令是 kt-kernel 提供的用户侧 CLI。

主命令

命令作用
kt version显示版本和环境信息。
kt doctor诊断环境问题。
kt run启动模型推理服务。
kt chat与运行中的模型交互。
kt model管理模型 registry 和模型路径。
kt config管理 CLI 配置。
kt quant在支持路径上量化模型权重。
kt bench / kt microbench运行 benchmark。
kt sft面向 LLaMA-Factory workflow 的微调辅助命令面。

常见推理命令

kt version
kt doctor
kt model list
kt model search m2
kt run m2.1 --dry-run
kt run m2.1

常见 Run Options

选项作用
--host--port服务绑定地址。
--gpu-expertsregistry 层的 GPU expert placement alias。
--cpu-threadsregistry 层的 CPU worker count alias。
--tensor-parallel-sizeTensor parallel size。
--kt-method在适用场景覆盖 KT method。
--attention-backend覆盖 attention backend。
--max-total-tokenstoken memory limit。
--dry-run只打印启动命令,不启动服务。

精确命令面以目标环境中的 kt run --help 为准。