生產環境優化 GLM4-MoE:透過 SGLang 實現 65% 更快的 TTFT 作為最先進的 GLM 4.7 模型持續在程式碼效能領域領先,Novita AI 持續致力於為開發者提供可靠、高效能的生產級 GLM 服務 作者 Novita AI / 2026年1月21日 / 5 分鐘閱讀