SGLang-FluentLLM:美团开源的LLM推理加速引擎,支持Eagle/MTP/PLD投机解码meituan-longcat/SGLang-FluentLLM 是美团开源的 LLM 推理引擎,重点优化投机解码工作流与内核融合,适合需要降低推理延迟的开发者参考。# GitHub开源项目# LLM推理加速# SGLang4小时前10,61446