С 754 млрд параметров (40 млрд активны) и специализированной архитектурой для долгосрочных агентных сценариев, GLM-5 создан именно для того варианта использования, который делает Claude Code мощным: многошаговые сессии программирования с интенсивным вызовом инструментов, требующие устойчивого рассуждения на тысячах строк кода.
Это руководство покажет, как интегрировать GLM-5 в Claude Code через API-провайдеров, таких как Novita AI, предоставляя вам доступ к интеллектуальным возможностям программирования уровня frontier по цене $1,00/$3,20 за миллион токенов — малая часть стоимости проприетарных моделей. Независимо от того, отлаживаете ли вы сложные системы, рефакторите устаревшие кодовые базы или создаете многофайловый функционал, контекстное окно GLM-5 в 200К+ токенов и проверенные агентные возможности делают его идеальным бэкендом для Claude Code.
Почему GLM-5 превосходно справляется с агентными задачами программирования
Прежде чем перейти к настройке, важно понять, почему GLM-5 уникально подходит для рабочих процессов Claude Code. В отличие от моделей, ориентированных на чат, GLM-5 обучался с явным акцентом на сложную системную инженерию и долгосрочные агентные задачи — те самые нагрузки, которые требуются от Claude Code.
Проверенная производительность на агентных бенчмарках


Показатель успешности сборки фронтенда (98%) указывает на то, что GLM-5 ведёт себя скорее как модель «инженерного исполнения», то есть она высоко способна выдавать результаты, которые действительно можно успешно запустить в реальных средах разработки.
Архитектура, оптимизированная для генерации кода
- DeepSeek Sparse Attention (DSA): Эффективно обрабатывает контекстные окна в 200К+ токенов, что критически важно для понимания всей репозитория
- Обучающий корпус из 28,5 трлн токенов: Больше и разнообразнее, чем 23 трлн токенов у GLM-4.5, что улучшает распознавание паттернов кода
- Обучение с подкреплением через
slime: Асинхронная инфраструктура RL дополнительно натренировала модель на точность вызова инструментов и многократную согласованность
Поддержка вызова инструментов и функций
GLM-5 включает нативную поддержку --tool-call-parser glm47 (подтверждено в документации по развёртыванию vLLM и SGLang), что означает, что он может:
- Разбирать и выполнять структурированные вызовы функций без галлюцинаций синтаксиса
- Сохранять точность вызова инструментов на протяжении 10+ последовательных шагов
- Надёжно работать с инструментами Claude Code:
Read,Write,Edit,Bash
Сравнение ROI по Vending Bench 2
| Модель | Итоговый денежный баланс (~день 365) | Стоимость | ROI = Баланс / Стоимость |
|---|---|---|---|
| Gemini 3 Pro | 5300 | 5478.16 | 0.97 |
| Claude Opus 4.5 | 4950 | 4967.06 | 1.00 |
| GLM-5 | 4350 | 4432.12 | 0.98 |
| GPT-5.2 | 3550 | 3591.33 | 0.99 |
| GLM-4.7 | 2350 | 2376.82 | 0.99 |
| Kimi K2.5 | 1150 | 1198.46 | 0.96 |
GLM-5 — это высокоисполнительная, высоконаградная агентная модель, но она достигает этого за счёт высокой стоимости вычислений и использования инструментов. По сути, это инженерно-ориентированный агент «плати больше — получай больше».
Что такое Claude Code?
Claude Code — это агентный помощник по программированию от Anthropic, представленный в виде настольного приложения (macOS/Linux). Он сочетает редактор, похожий на VS Code, с терминально-ориентированным ИИ-агентом, который может читать файлы, писать код, выполнять команды и автономно выполнять итерации по задачам. Представьте себе «Cursor с полным доступом к терминалу + выполнение многошаговых задач».
Ключевые преимущества:
- Глубокая интеграция с терминалом (может напрямую запускать
npm install,git commit,pytestи т.д.) - Постоянное состояние рабочего пространства между сессиями
- 10+ специализированных инструментов (Glob, Grep, WebFetch, Edit с точной заменой строк)
- Поддержка MCP (Model Context Protocol) для плагинов пользовательских инструментов
Варианты использования
| Вариант использования | Сценарий |
|---|---|
| Рефакторинг сложных систем | Миграция монолита в микросервисы из 50+ файлов |
| Рабочие процессы с активным терминалом | Развёртывание стека Docker, выполнение миграций, отладка K8s |
| Глубинные сессии отладки | Трассировка segfault, анализ дампов ядра, исправление состояний гонки |
| Автоматизация пользовательских сценариев | Интеграция GLM-5 с MCP-серверами (Slack, GitHub, Notion) |
Как использовать GLM-5 в Claude Code: полное руководство по настройке
Claude Code поддерживает пользовательские модели через API-эндпоинты, совместимые с OpenAI. Мы будем использовать Novita AI в качестве провайдера, поскольку он предлагает бессерверный хостинг GLM-5 с прозрачной ценой ($1,00/$3,20 за миллион токенов).
Шаг 1: Получите API-ключ Novita AI
- Перейдите на novita.ai
- Зарегистрируйтесь или войдите в свой аккаунт
- В панели управления перейдите в раздел API Keys
- Нажмите Create New Key и скопируйте ключ
- Храните его в безопасности — он понадобится для переменных окружения

Шаг 2: Установите Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Для Windows требуется Git for Windows. Если его нет, сначала установите его.
Шаг 3: Настройте переменные окружения
Claude Code считывает конфигурацию из переменных окружения. Установите их в своём профиле оболочки:
Для macOS/Linux:
# Устанавливаем эндпоинт API, совместимый с Anthropic SDK, предоставляемый Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Ключ API Novita>"
# Устанавливаем модель, предоставляемую Novita.
export ANTHROPIC_MODEL="zai-org/glm-5"
export ANTHROPIC_SMALL_FAST_MODEL="zai-org/glm-5"
Для Windows:
# Добавьте в свой профиль PowerShell
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Ключ API Novita"
$env:ANTHROPIC_MODEL = "zai-org/glm-5"
$env:ANTHROPIC_SMALL_FAST_MODEL = "zai-org/glm-5"
Важно: Переменная ANTHROPIC_SMALL_FAST_MODEL используется для быстрых задач (навигация по файлам, поиск).
Шаг 4: Запустите Claude Code
Затем перейдите в директорию вашего проекта и запустите Claude Code. Claude Code проанализирует текущую директорию проекта и будет использовать её в качестве рабочего контекста. Вы увидите приглашение Claude Code в новом интерактивном сеансе.
cd <директория-вашего-проекта>
claude .
Шаг 5: Используйте Git с Claude Code
Claude Code делает операции с Git диалоговыми:
> какие файлы я изменил?
> закоммить мои изменения с описательным сообщением
Вы также можете запрашивать более сложные операции Git:
> создай новую ветку с именем feature/quickstart
> покажи последние 5 коммитов
> помоги разрешить конфликты слияния
Советы по производительности: как выжать максимум из GLM-5
1. Полностью используйте контекстное окно
Контекст GLM-5 в 200К+ токенов — это большое преимущество. Вместо того чтобы просить «исправь эту функцию», загрузите весь модуль:
Запрос: "Прочитай все файлы в src/auth/. Проанализируй поток аутентификации, выяви уязвимости безопасности и предложи исправления с примерами кода."
2. Явно используйте конкретные инструменты
При необходимости явно направляйте GLM-5 к нужным инструментам:
Запрос: "Используй Grep, чтобы найти все вхождения 'deprecated_function' во всей кодовой базе, затем используй Edit, чтобы заменить их на 'new_function'."
3. Включите спекулятивное декодирование (для самостоятельного хостинга)
Если вы запускаете GLM-5 локально через vLLM, используйте --speculative-config.method mtp для ускорения генерации на 30-50%.
4. Разбивайте задачи на этапы
Разбивайте сложные проекты на части из 3–5 шагов:
Сессия 1: "Спроектируй схему базы данных для блога. Создай модели SQLAlchemy."
Сессия 2: "Реализуй CRUD-эндпоинты для постов с помощью FastAPI."
Сессия 3: "Добавь middleware для аутентификации и ограничения скорости."
Архитектура MoE с 754 млрд параметров, контекстное окно в 200К+ токенов и специализированное обучение на сложной системной инженерии делают эту модель уникально подходящей для рефакторинга на уровне репозитория, многошаговой отладки и агентной автоматизации. Независимо от того, выбираете ли вы Claude Code для рабочих процессов с активным терминалом или нет, показатели производительности и экономическая эффективность GLM-5 позиционируют его как лучший выбор для инструментов ИИ, ориентированных на разработчиков, в 2026 году.
Часто задаваемые вопросы
Можно ли запускать GLM-5 локально, или обязательно использовать API?
GLM-5 можно запускать локально через vLLM или SGLang, но для этого требуется 16 графических процессоров H100 с 80 ГБ памяти для квантизации FP8. Для большинства пользователей практичнее хостинг через API (Novita, OpenRouter).
Как GLM-5 сравнивается с DeepSeek V3 для программирования?
GLM-5 набирает более высокие баллы на агентных бенчмарках (Индекс интеллекта — 50 против 45 у DeepSeek V3), в то время как DeepSeek V3 быстрее для чистового завершения кода. Выбирайте GLM-5 для многошаговых задач.
Поддерживает ли GLM-5 вызов функций и использование инструментов?
Да — GLM-5 включает нативную поддержку --tool-call-parser glm47 и --enable-auto-tool-choice, подтверждённую в официальных руководствах по развёртыванию.
Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также доступный и надёжный облачный GPU для создания и масштабирования.
Рекомендуемое чтение
Use Qwen3-Coder-Next in Claude Code: An 80% Cheaper Alternative
