Novita AI объединяется с Z.ai для предоставления GLM-4.5: объединение возможностей рассуждения, программирования и агентного ИИ

Содержание

⚡ Общая производительность
🚀 Начните работу с Novita AI
🔬 Технические инновации GLM-4.5
🎯 Готовы испытать унифицированный ИИ?

Сегодня мы с радостью объявляем о партнерстве Novita AI с Z.ai, благодаря которому мы предоставляем поддержку GLM-4.5 с первого дня на платформе Novita AI в качестве партнера по запуску Z.ai. Это новаторское сотрудничество представляет самую унифицированную серию моделей ИИ в мире, объединяющую продвинутое рассуждение, сложные возможности программирования и встроенную агентную функциональность в единой мощной платформе, предназначенной для разработчиков, создающих приложения ИИ следующего поколения.

Novita AI теперь предлагает революционную модель GLM-4.5 (355B всего параметров, 32B активных): построенную с гибридными режимами рассуждения, включающими как режим мышления для сложных рассуждений и использования инструментов, так и режим без мышления для мгновенных ответов. Занимает 2-е место в общем зачете по всесторонним бенчмаркам.

Обе модели имеют длину контекста 128k и встроенную возможность вызова функций, доступные через оптимизированную инфраструктуру вывода Novita AI.

⚡ Общая производительность

GLM-4.5 занимает 2-е место, а GLM-4.5-Air — 5-е среди 12 бенчмарков, охватывающих задачи агентного ИИ (3), рассуждения (7) и программирования (2), по сравнению с моделями от OpenAI, Anthropic, Google DeepMind, xAI, Alibaba, Moonshot и DeepSeek.

GLM-4.5 объединяет все возможности, в которых предыдущие модели преуспевали в конкретных областях — программировании, математике или рассуждении, — но ни одна не достигала наилучшей производительности во всех задачах.

Задачи агентного ИИ

GLM-4.5 — это фундаментальная модель, оптимизированная для агентных задач. Она обеспечивает длину контекста 128k и встроенную возможность вызова функций. Z.ai измерила ее агентные способности на τ-bench и BFCL-v3 (Berkeley Function Calling Leaderboard v3). В обоих бенчмарках GLM-4.5 соответствует производительности Claude-4-Sonnet.

Веб-браузинг — популярное агентное приложение, требующее сложного рассуждения и многошагового использования инструментов. Z.ai оценила GLM-4.5 на бенчмарке BrowseComp, сложном тесте для веб-браузинга, состоящем из сложных вопросов, требующих коротких ответов. С доступом к инструменту веб-браузинга GLM-4.5 дает правильные ответы на 26,4% всех вопросов, значительно опережая Claude-4-Opus (18,8%) и приближаясь к o4-mini-high (28,0%).

Бенчмарк	GLM-4.5	GLM-4.5-Air	o3	o4-mini-high	GPT-4.1	Claude 4 Opus	Claude 4 Sonnet	Gemini 2.5 Pro	Qwen3 235B Thinking 2507	DeepSeek R1 0528	Kimi K2	Grok4
TAU-bench	70.1	69.4	61.2	57.4	62.0	70.5	70.3	62.5	73.2	58.7	62.6	67.5
BFCL v3 (Full)	77.8	76.4	72.4	67.2	68.9	61.8	75.2	61.2	72.4	63.8	71.1	66.2
BrowseComp	26.4	21.3	49.7	28.3	4.1	18.8	14.7	7.6	4.6	3.2	7.9	32.6

Рассуждение

В режиме мышления GLM-4.5 и GLM-4.5-Air могут решать сложные задачи на рассуждение, включая математику, науку и логические задачи.

Бенчмарк	GLM-4.5	GLM-4.5-Air	o3	o4-mini-high	Claude 4 Opus	Claude 4 Sonnet	Gemini 2.5 Pro	Gemini 2.5 Flash	DeepSeek R1 0528	Qwen3-235B Thinking 2507	Grok4
MMLU Pro	84.6	81.4	85.3	83.2	87.3	84.2	86.2	83.2	84.9	84.5	86.6
AIME24	91.0	89.4	90.3	94.0	75.7	77.3	88.7	82.3	89.3	94.1	94.3
MATH 500	98.2	98.1	99.2	98.9	98.2	99.1	96.7	98.1	98.3	98.0	99.0
SciCode	41.7	37.3	41.0	46.5	39.8	40.0	42.8	39.4	40.3	42.9	45.7
GPQA	79.1	75.0	82.7	78.4	79.6	77.7	84.4	79.0	81.3	81.1	87.7
HLE	14.4	10.6	20.0	17.5	11.7	8.5	21.1	11.1	14.9	15.8	23.9
LiveCodeBench (2407-2501)	72.9	70.7	78.4	80.4	63.6	58.0	80.1	69.5	77.0	78.2	81.9
AA-Index (Estimated)	67.7	64.8	70.0	69.8	64.4	62.7	70.5	65.1	68.3	69.4	73.2

Программирование

GLM-4.5 также хорош в программировании, включая как создание проекта с нуля, так и агентное решение задач программирования в существующих проектах. Его можно легко комбинировать с существующими инструментами программирования, такими как Claude Code, Roo Code и CodeGeex. Для оценки способностей к программированию Z.ai сравнила различные модели на SWE-bench Verified и Terminal Bench.

Бенчмарк	GLM-4.5	GLM-4.5-Air	o3	o4-mini-high	GPT-4.1	Claude 4 Opus	Claude 4 Sonnet	Gemini 2.5 Pro	Gemini 2.5 Flash	Qwen3 235B Thinking 2507	Qwen3 235B	DeepSeek R1 0528	Kimi K2
SWE-bench Verified	64.2	57.6	69.1	54.8	48.6	67.8	70.4	49.0	60.4	35.0	36.2	41.4	65.4
Terminal-Bench	37.5	30.0	30.2	18.5	30.3	43.2	35.5	25.3	16.8	6.3	6.6	17.5	25.0

Чтобы оценить агентные возможности GLM-4.5 в реальных сценариях, Z.ai использовала Claude Code для проведения всестороннего тестирования против Claude-4-Sonnet, Kimi K2 и Qwen3-Coder с использованием 52 задач по программированию, охватывающих фронтенд-разработку, разработку инструментов, анализ данных, тестирование и алгоритмические приложения. GLM-4.5 побеждает Kimi K2 в 53,9% задач и доминирует над Qwen3-Coder с 80,8% побед, при этом показывая возможности для улучшения по сравнению с Claude-4-Sonnet.

Примечательно, что GLM-4.5 достигает самого высокого среднего показателя успешности вызова инструментов — 90,6%, опережая Claude-4-Sonnet (89,5%), Kimi-K2 (86,2%) и Qwen3-Coder (77,1%), демонстрируя превосходную надежность и эффективность в агентных задачах программирования.

🚀 Начните работу с Novita AI

Используйте Playground (без программирования)

Мгновенный доступ: Зарегистрируйтесь и начните экспериментировать с GLM-4.5 за секунды
Интерактивный интерфейс: Тестируйте сложные подсказки для рассуждения и визуализируйте структурированные результаты в реальном времени
Сравнение моделей: Сравните GLM-4.5 с другими ведущими моделями для вашего конкретного случая использования

Интеграция через API (для разработчиков)

Подключите GLM-4.5 к вашим приложениям с помощью унифицированного REST API Novita AI.

Вариант 1: Прямая интеграция API (пример на Python)

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_S4q9KTdBQujFkXSE5aZYZCrwN9f5QO96BtAFLw4FOgB__slLHW9KFAjmMgC12ag6mf2lJ1rASEvHbP_gv7Jh2Q==",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Ключевые возможности:

API, совместимый с OpenAI для бесшовной интеграции
Гибкое управление параметрами для точной настройки ответов
Поддержка потоковой передачи для ответов в реальном времени

Вариант 2: Многоагентные рабочие процессы с OpenAI Agents SDK Создавайте сложные многоагентные системы с использованием GLM-4.5:

Интеграция “подключи и работай”: Используйте GLM-4.5 в любом рабочем процессе OpenAI Agents
Расширенные агентные возможности: Поддержка передачи задач, маршрутизации и интеграции инструментов с 90,6% успешности
Масштабируемая архитектура: Проектируйте агентов, использующих унифицированные возможности GLM-4.5 в рассуждении, программировании и агентном ИИ

Подключение к сторонним платформам

Инструменты разработки: Бесшовная интеграция с популярными IDE и средами разработки, такими как Cursor и Cline, через API, совместимые с OpenAI
Оркестрационные фреймворки: Подключение к LangChain, Dify, Langflow и другим платформам оркестрации ИИ с использованием официальных коннекторов
Интеграция с Hugging Face: Используйте GLM-4.5 в Spaces, пайплайнах или с библиотекой Transformers через конечные точки Novita AI

🔬 Технические инновации GLM-4.5

Превосходство архитектуры MoE

GLM-4.5 использует архитектуру Mixture of Experts (MoE), повышающую вычислительную эффективность как для обучения, так и для вывода. По сравнению с DeepSeek-V3, конструкция уменьшает ширину (скрытое измерение и маршрутизируемые эксперты), увеличивая высоту (количество слоев).

Ключевые технические особенности:

Grouped-Query Attention с частичным RoPE (продолжение от ChatGLM2)
QK-Norm для стабилизации диапазона логитов внимания
Оптимизатор Muon для ускоренной сходимости и устойчивости к большему размеру батча
Слой MTP (Multi-Token Prediction) для поддержки спекулятивного декодирования во время вывода

Продвинутый конвейер обучения

Предварительное обучение: Двухэтапный подход

15 трлн токенов на общем корпусе предварительного обучения
7 трлн токенов на корпусе кода и рассуждений

Промежуточное обучение: Оптимизация под конкретные домены

Данные кода на уровне репозитория (500 млрд токенов)
Синтетические данные для рассуждений (500 млрд токенов)
Данные длинного контекста и агентного ИИ (100 млрд токенов)

Пост-обучение: Сложный гибридный подход

Экспертное обучение: Отдельные модели для доменов Рассуждения, Агентного ИИ и Общего через SFT и специализированное RL
Унифицированное обучение: Дистилляция знаний с объединением экспертов в единую модель через масштабную SFT-самодистилляцию, с последующим трехэтапным RL-выравниванием

slime: Революционная инфраструктура RL

Обучение GLM-4.5 обеспечивается slime — открытой инфраструктурой RL, предназначенной для крупномасштабных моделей:

Гибкая гибридная архитектура обучения: Поддерживает как синхронное совместное обучение, так и раздельное асинхронное обучение
Разделенный агентно-ориентированный дизайн: Разделяет механизмы развертывания и обучения для оптимизации производительности
Ускоренная генерация данных: Смешанная точность вывода с использованием FP8 для генерации данных при сохранении стабильности BF16 для обучения

🎯 Готовы испытать унифицированный ИИ?

Попробуйте GLM-4.5 и GLM-4.5-Air уже сегодня на платформе Novita AI. Воочию убедитесь, как унифицированные возможности ИИ меняют представление о возможном, когда рассуждение, программирование и агентные функции сходятся в оптимизированной, готовой к производству инфраструктуре.

Начать создавать сегодня →

Novita AI — это облачная платформа ИИ, которая предлагает разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предоставляет доступный и надежный GPU-облако для создания и масштабирования.

Novita AI объединяется с Z.ai для предоставления GLM-4.5: объединение возможностей рассуждения, программирования и агентного ИИ