CPU/GPU 要求

KTransformers serving 同时依赖 GPU 显存和 CPU expert 吞吐。可用配置是 GPU、CPU ISA、内存容量、NUMA 拓扑、模型 checkpoint 和 KT method 的组合。

基线要求

组件	建议
OS	当前公开包主线为 Linux x86-64。
Python	`kt-kernel` wheel 支持 Python 3.10、3.11、3.12。
GPU	当前 serving 主线是 NVIDIA Ampere 或更新架构。
CPU	兼容路径最低 AVX2；高吞吐路径通常需要 AVX512 或 AMX。
内存	大型 MoE 模型需要较大系统内存；具体取决于 method 和 CPU 权重格式。
NUMA	多 socket 系统需要调 `--kt-threadpool-count` 和 CPU placement。

先从模型支持组合开始：

模型 + method + CPU backend + GPU 数量 + 系统内存 + 包版本

再调：

硬件支持以具体模型和 method 的 smoke 结果为准。看到“支持某类硬件”时，仍需要核对模型、method、CPU backend、GPU 数量、系统内存和包版本是否一致。