GLM-4.7 теперь доступен на платформе Novita AI, что предоставляет серверный API, совместимый с OpenAI, для последней флагманской текстовой модели Z.AI. GLM-4.7 оптимизирован для агентного программирования, долгосрочного планирования и рабочих процессов с использованием инструментов, с более надёжной связкой «думай → действуй» и заметно улучшенной эстетикой фронтенда для реальной поставки продуктов.
На Novita AI вы можете запускать GLM-4.7 с контекстом 204 800, выходом до 131 072, квантованием fp8 и встроенной поддержкой Function Calling и Structured Output.
Что такое GLM-4.7?
GLM-4.7 — это последняя флагманская текстовая модель Z.AI, в которой основные улучшения сосредоточены на продвинутом программировании, долгосрочном планировании задач и более надёжном взаимодействии с инструментами — она предназначена для выполнения задач от начала до конца, а не просто для генерации изолированных фрагментов кода.
Основные характеристики (официальные):
- Контекстное окно: 200K токенов
- Максимальный выход: 128K токенов
- Возможности: режимы мышления, стриминг, вызов функций, кэширование контекста, структурированный вывод (JSON) и интеграция с MCP-инструментами/источниками данных
💡Что вы получаете на Novita AI (готовый к продакшену serverless):
Параметр Значение Модель GLM-4.7 Длина контекста 204 800 Максимальный выход 131 072 Квантование fp8 Function Calling / Structured Output Поддерживается
Почему GLM-4.7 на Novita AI
Прозрачное ценообразование serverless (оплата за токен)
На Novita AI GLM-4.7 работает как serverless-эндпоинт с понятной пото́кенной оплатой:
- Ввод: $0,6 / 1M токенов
- Cache Read: $0,11 / 1M токенов
- Вывод: $2,2 / 1M токенов
Строка Cache Read важна: она позволяет эффективно по стоимости выполнять долгосрочные рабочие процессы (например, «агент, работающий с большим репозиторием/спецификацией на протяжении многих шагов»). Нажмите здесь, чтобы узнать больше о ценах.
API, совместимый с OpenAI, для мгновенной интеграции
Если вы уже используете API в стиле Chat Completions от OpenAI, вы можете перейти, указав базовый URL Novita и изменив имя модели — не нужно изучать новый протокол.
Создан для агентной поставки
Z.AI позиционирует GLM-4.7 вокруг «выполнения задач» с более строгим следованием инструкциям при использовании инструментов и улучшенной стабильностью для сложных агентных циклов.
Возможности GLM-4.7 и бенчмарки
GLM-4.7 разработан для агентного программирования (поставка задач от начала до конца), более сильного рассуждения с управляемым мышлением и более надёжных рабочих процессов с использованием инструментов — с заметным скачком в качестве генерации веб-страниц/интерфейсов («vibe coding»).
Возможности
- Агентное программирование от начала до конца: лучшее планирование, реализация и итерация в многомодульных проектах и реальных агентных фреймворках.
- Мышление перед действием (более стабильные агенты): улучшенное следование инструкциям и стабильность при выполнении сложных задач; поддержка управления на уровне шагов для баланса стоимости/задержки и надёжности.
- Использование инструментов и веб-сёрфинг: более надёжные паттерны выполнения инструментов и задачи, связанные с просмотром веб-страниц.
- Повышение сложного рассуждения: измеримые улучшения в сложных задачах на рассуждение (в том числе с использованием инструментов).
- Vibe Coding (качество UI и слайдов): более чистые современные веб-страницы и более качественные слайды/макеты.
Стандартизированные бенчмарки
Следующие результаты предоставлены Z.AI:
| Категория | Бенчмарк | GLM-4.7 |
| Программирование (реальный багфикс) | SWE-bench Verified | 73.8 |
| Агент / терминал | Terminal Bench 2.0 | 41.0 |
| Программирование (live) | LiveCodeBench v6 | 84.9 |
| Использование инструментов (интерактивное) | τ²-Bench | 87.4 |
| Веб-сёрфинг | BrowseComp | 52.0 (и 67.5 с управлением контекстом) |
| Рассуждение (инструменты) | HLE (w/ Tools) | 42.8 |

Сигнал «человеческих предпочтений» LMArena
Рейтинги LMArena основаны на слепых голосах пользователей и служат полезным дополнением к бенчмаркам, отражая «как это ощущается».
-
WebDev Leaderboard: GLM-4.7 занимает #6 с оценкой 1447 (+10/-10), 4 833 голоса (последнее обновление 16 января 2026).
-
Text Arena (Overall): GLM-4.7 занимает #18 с оценкой 1443 (±7), 8 258 голосов (последнее обновление 12 января 2026).
🏆Позиционирование среди открытых моделей: на обеих таблицах модели, расположенные выше GLM-4.7, указаны с лицензиями Proprietary, тогда как GLM-4.7 имеет лицензию MIT — что делает её самой высокорейтинговой моделью с открытой лицензией в WebDev и Text (Overall) на момент обновления этих таблиц.
Начало работы с GLM-4.7 на Novita AI
Вариант A: Использовать Playground
Самый простой способ познакомиться с GLM-4.7 — попробовать его напрямую в Playground Novita AI. Вы можете начать взаимодействовать с GLM-4.7 мгновенно в Playground Novita AI — без настройки, без кода. Просто зарегистрируйтесь, откройте Playground и тестируйте запросы в реальном времени. Новые аккаунты получают бесплатные кредиты после регистрации, так что вы можете сразу попробовать модель.
Вариант B: Интеграция через API
Подключите GLM-4.7 к своим приложениям с помощью единого REST API Novita AI.
Получение API-ключа на Novita AI
- Шаг 1: Создайте аккаунт или войдите в него
Перейдите на [https://novita.ai](https://novita.ai) и зарегистрируйтесь или войдите в существующий аккаунт.
- Шаг 2: Перейдите в управление ключами
После входа найдите раздел «API Keys».
- Шаг 3: Создайте новый ключ
Нажмите кнопку «Add New Key».
- Шаг 4: Немедленно сохраните ключ
Скопируйте и сохраните ключ сразу после генерации; обычно он показывается только один раз и не может быть восстановлен позже. Храните ключ в надёжном месте, например в менеджере паролей или зашифрованных заметках.
Прямая интеграция через API
from openai import OpenAI
client = OpenAI(
api_key="<Ваш API-ключ>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="zai-org/glm-4.7",
messages=[
{"role": "system", "content": "Вы — полезный ассистент."},
{"role": "user", "content": "Привет, как дела?"}
],
max_tokens=131072,
temperature=0.7
)
print(response.choices[0].message.content)
Многоагентные рабочие процессы с OpenAI Agents SDK
Создавайте сложные агентные системы с интеграцией «включай и работай» — поддержка передачи (handoffs), маршрутизации и использования инструментов через встроенный вызов функций, а также полное окно длинного контекста для сложных многошаговых задач.
Вариант C: Подключение через сторонние платформы
Если вы уже работаете с агентными фреймворками или инструментами разработчика, Novita AI спроектирована для подключения с минимальными усилиями:
- Агентные фреймворки и конструкторы приложений: следуйте пошаговым руководствам Novita по интеграции с популярными инструментами, такими как Continue, AnythingLLM, LangChain и Langflow.
- Hugging Face Hub: Novita указана как Inference Provider на Hugging Face, поэтому вы можете запускать поддерживаемые модели через рабочий процесс и экосистему Hugging Face.
- API, совместимый с OpenAI: эндпоинты LLM Novita совместимы со стандартом API OpenAI, что упрощает миграцию существующих приложений на OpenAI и подключение многих инструментов, совместимых с OpenAI ( Cline, Cursor, Trae и Qwen Code).
- API, совместимый с Anthropic (рабочие процессы Claude Code): Novita также предоставляет доступ, совместимый с Anthropic SDK, так что вы можете интегрировать модели на базе Novita в стиле агентного программирования Claude Code.
- OpenCode (встроенный провайдер): Novita AI теперь интегрирована непосредственно в OpenCode как поддерживаемый провайдер, так что пользователи могут выбрать Novita в OpenCode без ручной настройки.
Продакшен-паттерны
- Используйте Prompt Cache для долгосрочных агентов
Если вы запускаете многошаговые рабочие процессы с большим стабильным контекстом (снимок репозитория, длинная спецификация, проектный документ), кэширование может значительно снизить затраты — Novita явно указывает цену Cache Read.
- Structured Output для надёжных пайплайнов
При интеграции с движками рабочих процессов, валидаторами или UI предпочтительнее использовать структурированные выводы в формате JSON (на основе схемы), чтобы уменьшить количество проблем при парсинге. Novita указывает Structured Output как поддерживаемый для GLM-4.7.
- Function Calling для программирования с инструментами
Оберните ваши инструменты как функции: поиск по репозиторию, просмотр тикета, запуск CI, чтение базы данных, веб-запрос — затем позвольте модели решать, когда их вызывать. GLM-4.7 явно спроектирован для более надёжного взаимодействия с инструментами.
- Политика режима мышления: «быстро по умолчанию, глубоко когда нужно»
- простые вопросы/форматирование: мышление выключено
- отладка/многошаговый рефакторинг: мышление включено
- длинные задачи: рассмотрите режимы, которые повышают стабильность и частоту попадания в кэш
Заключение
GLM-4.7 предлагает практичный набор улучшений для разработчиков, создающих агентное программирование и долгосрочные рабочие процессы с использованием инструментов: контекст 200K, управляемое мышление, более надёжное поведение вызова функций и улучшенные результаты «vibe coding» фронтенда.
На Novita AI вы можете начать немедленно с серверного API, совместимого с OpenAI, с прозрачной пото́кенной оплатой и встроенной поддержкой вызова функций и структурированных выводов — готового для продакшен-уровня агентных пайплайнов.
Novita AI — это облачная AI-платформа, которая предоставляет разработчикам простой способ развёртывания AI-моделей через наш простой API, а также доступные и надёжные GPU-облака для сборки и масштабирования.
Часто задаваемые вопросы
Что такое GLM-4.7?
GLM-4.7 — это флагманская LLM от Z.AI, позиционируемая для улучшенного программирования и более стабильного многошагового рассуждения/выполнения; выпущена с официальной моделью с открытыми весами (доступна на Hugging Face).
Является ли GLM-4.7 бесплатным?
На Novita AI GLM-4.7 оплачивается пото́кенно: $0,6/М токенов (ввод), $0,11/М токенов (cache read) и $2,2/М токенов (вывод).
На Z.ai доступ обычно оформлен через платный тариф Coding Plan (начиная от $3/месяц).
Некоторые платформы могут предлагать ограниченные пробные версии/квоты, например Novita AI, но GLM-4.7 сам по себе не является повсеместно «бесплатным».
Действительно ли GLM-4.7 хорош?
Для программирования и агентных рабочих процессов он позиционируется как одна из лучших открытых моделей по заявлению издателя. Z.AI сообщает о сильных результатах на бенчмарках программирования и агентов (например, LiveCodeBench v6, SWE-bench Verified, BrowseComp, τ²-Bench) и представляет его как конкурента Claude Sonnet 4.5 по нескольким измерениям.

