GLM-4.5 против ChatGPT-4.1: Системность или выразительность

GLM-4.5 против ChatGPT-4.1: Системность или выразительность

Ключевые моменты

GLM-4.5 — фундаментальная модель, объединяющая возможности рассуждения, программирования и интеллектуальных агентов для удовлетворения сложных требований приложений на основе агентов.

ChatGPT-4.1 — мультимодальная фундаментальная модель с продвинутыми способностями к рассуждению, оптимизированная для универсального решения задач и человекоподобного общения в различных областях и приложениях.

Novita AI не только предоставляет стабильные API-сервисы, но и предлагает чрезвычайно выгодные цены. Например, GLM-4.5 стоит $0.6 за 1M входных токенов и $2.2 за 1M выходных токенов.

Основное описание модели

GLM-4.5

GLM-4.5 — это фундаментальная модель, предназначенная для интеллектуальных агентов, с общим количеством параметров 355 миллиардов и 32 миллиардами активных параметров. Модель объединяет возможности рассуждения, программирования и агентов для удовлетворения сложных требований приложений на основе агентов. GLM-4.5 — это гибридная модель рассуждений, которая предоставляет два режима: режим мышления для сложных рассуждений и использования инструментов, и режим без размышлений для немедленных ответов.

Ключевые особенности и архитектура

  • Параметры: 355 миллиардов всего, 32 миллиарда активных.
  • Гибридное рассуждение: Два режима работы — режим мышления для сложных рассуждений и использования инструментов, и режим без размышлений для немедленных ответов.
  • Версии модели: Доступны в виде базовых моделей, гибридных моделей рассуждения и версий FP8.
  • Контекстное окно: 128K токенов.
  • Лицензия: Открытая лицензия MIT для коммерческого использования и вторичной разработки.
  • Возможности: Объединённые функции рассуждения, программирования и интеллектуальных агентов для сложных приложений.

ChatGPT-4.1

ChatGPT-4.1, выпущенный 14 апреля 2025 года компанией OpenAI, предлагает прорывные улучшения в понимании контекста с родным контекстным окном в 1 миллион токенов, на 21% улучшенные возможности программирования по сравнению с GPT-4o и превосходную мультимодальную обработку текста, изображений и документов. Построенный на оптимизированной архитектуре трансформера с улучшенными механизмами внимания, ChatGPT-4.1 достигает передовых результатов в академических бенчмарках AIME, GPQA, MMLU, оценках программирования SWE-bench и задачах зрения MMMU/MathVista.

Ключевые особенности и архитектура

  • Тип: Продвинутая большая языковая модель с мультимодальными возможностями
  • Дата выпуска: 14 апреля 2025 года
  • Контекстное окно: 1M токенов нативно
  • Производительность в программировании: Улучшение на 21% в возможностях программной инженерии по сравнению с GPT-4o
  • Мультимодальная поддержка: Расширенные возможности анализа текста, изображений и документов
  • Следование инструкциям: Продвинутое соблюдение требований пользователя к форматированию и задачам

Сравнение бенчмарков

1. Бенчмарки интеллекта

GLM-4.5 benchmark 1

2. Контекстное окно:

GLM-4.5: 128k токенов

ChatGPT-4.1: 1M токенов

3. Цены API:

GLM-4.5: $0.6 / $2.2 вход/выход за 1M токенов

ChatGPT-4.1: $2 / $8 вход/выход за 1M токенов

Тестирование прикладных навыков GLM-4.5 и GPT-4.1

1. Задача по программированию: GLM-4.5 против GPT-4.1

Промпт:

Реализуйте функцию для объединения перекрывающихся интервалов и возврата результата, отсортированного по времени начала.

Входные данные: список интервалов в виде кортежей [(start, end), …]
Выходные данные: список объединённых интервалов
Ограничение: обработайте граничные случаи и оптимизируйте для читаемости

Пример:
intervals = [(1,3), (2,6), (8,10), (15,18)]
Ожидаемый результат: [(1,6), (8,10), (15,18)]

intervals = [(1,4), (4,5)]
Ожидаемый результат: [(1,5)]

Критерии оценки (10 баллов):

  • Корректность алгоритма (4 балла): Правильное объединение перекрывающихся интервалов, обработка граничных случаев (пустой список, один интервал, касающиеся интервалы)
  • Эффективность кода (3 балла): Оптимальный подход (сначала сортировка, затем объединение за один проход), чистая логика
  • Качество кода (2 балла): Читаемые имена переменных, правильная структура, проверка входных данных
  • Обработка граничных случаев (1 балл): Явная обработка особых случаев, таких как пустой ввод, один интервал и т.д.

GLM-4.5

GLM 4.5 Coding Performance

ChatGPT-4.1

Chatgpt4.1 code

Анализ кода и оценка

Критерий GPT-4.1 GLM-4.5 Баллы
Корректность алгоритма (4 балла) Правильная логика объединения, обрабатывает все граничные случаи Правильная логика объединения, обрабатывает все граничные случаи GPT-4.1: 4/4
GLM-4.5: 4/4
Эффективность кода (3 балла) Оптимальный подход O(n log n), чистый однопроходный merge Оптимальный подход O(n log n), чистый однопроходный merge GPT-4.1: 3/3
GLM-4.5: 3/3
Качество кода (2 балла) Понятные имена переменных, встроенные комментарии, хорошая структура Чистая структура, но нет встроенных комментариев GPT-4.1: 2/2
GLM-4.5: 1.5/2
Обработка граничных случаев (1 балл) Явно документирует 5 граничных случаев с примерами Упоминает граничные случаи, но менее явная документация GPT-4.1: 1/1
GLM-4.5: 0.5/1

Итоговые баллы

  • GPT-4.1: 10/10 баллов
  • GLM-4.5: 9/10 баллов

Обе модели дают алгоритмически корректные и эффективные решения. GPT-4.1 вырывается вперёд за счёт превосходной практики документирования — встроенные комментарии и явное перечисление граничных случаев с примерами. GLM-4.5 предлагает отличное объяснение алгоритма и чистую структуру кода, но не хватает всесторонней документации, которая делает код готовым к производству. Оценка отражает объективные различия в стандартах документирования кода, а не в алгоритмических способностях.

2. Задача по креативному письму: GLM-4.5 против GPT-4.1

Промпт

Напишите короткий рассказ (300–500 слов) под названием «Последняя библиотека на Земле». Действие должно происходить в постапокалиптическом мире, где физические книги вымерли, кроме одной скрытой библиотеки. Ваш главный герой обнаруживает эту библиотеку и должен принять решающее решение о её судьбе. Включите в повествование элементы как надежды, так и утраты.

Критерии оценки (10 баллов):

Критерий Баллы Описание
Креативность и оригинальность (3 балла) 3 Уникальные сюжетные элементы, инновационное построение мира, оригинальные концепции персонажей
2 Некоторые креативные элементы, неплохое построение мира, стандартная проработка персонажей
1 Базовая креативность, минимальная оригинальность, предсказуемые элементы
Структура повествования (2 балла) 2 Хорошо выдержанный ритм рассказа с чётким началом/серединой/концом, плавные переходы
1 Адекватная структура с некоторыми проблемами темпа
0 Слабая структура, неясное развитие
Развитие персонажа (2 балла) 2 Захватывающий главный герой с чёткими мотивациями и эмоциональной глубиной
1 Базовая проработка персонажа, некоторая эмоциональная связь
0 Слабая характеристика, неясные мотивации
Интеграция темы (2 балла) 2 Искусно балансирует надежду и утрату, осмысленное исследование тем
1 Адекватные тематические элементы, некоторый баланс достигнут
0 Плохая интеграция темы, несбалансированные или неясные темы
Язык и стиль (1 балл) 1 Увлекательная проза, соответствующий тон, эффективный выбор слов
0.5 Адекватный стиль письма с незначительными проблемами
0 Плохое использование языка, неуместный тон, неясное выражение

Дополнительные примечания к оценке:

  • Рассказы должны укладываться в лимит 300–500 слов
  • Учитывайте эмоциональное воздействие и вовлечённость читателя
  • Оцените, насколько хорошо ИИ справляется с конкретными ограничениями промпта
  • Ищите согласованность между названием и содержанием рассказа

GLM-4.5

Creative Writing Challenge:  GLM-4.5

ChatGPT-4.1

Creative Writing Challenge: GPT-4.1

Анализ рассказа и оценка

Критерий GLM-4.5 GPT-4.1 Баллы
Креативность и оригинальность (3 балла) Концепция «Войны данных», нейронные сети против книг, инновационный технологический фон Традиционная постапокалиптическая обстановка со знакомыми элементами GLM-4.5: 3/3
GPT-4.1: 2/3
Структура повествования (2 балла) Хорошо выдержанная семидневная арка, чёткое развитие решения, удовлетворительная развязка Хорошая структура, но поспешная концовка, быстрое решение GLM-4.5: 2/2
GPT-4.1: 1.5/2
Развитие персонажа (2 балла) Элиас проявляет вдумчивое созерцание, значительный рост персонажа У Мары есть эмоциональные моменты, но меньше глубины проработки GLM-4.5: 2/2
GPT-4.1: 1.5/2
Интеграция темы (2 балла) Утончённое исследование сохранения знаний, метафора строительства моста Сильный баланс надежды/утраты, но более поверхностная тематическая проработка GLM-4.5: 2/2
GPT-4.1: 1.5/2
Язык и стиль (1 балл) Чистая, целенаправленная проза с эффективным построением мира Выразительные образы, но иногда чрезмерно вычурные описания GLM-4.5: 1/1
GPT-4.1: 0.5/1

Итоговые баллы

  • GLM-4.5: 10/10 баллов
  • GPT-4.1: 8.5/10 баллов

GLM-4.5 представляет более интеллектуально сложное повествование с превосходным построением мира и тематической глубиной. Концепция «Войны данных» и общество нейронных сетей создают по-настоящему инновационный фон, а семидневные размышления Элиаса демонстрируют значительное развитие персонажа. Метафора строительства моста между старыми и новыми системами знаний демонстрирует утончённую интеграцию тем.

GPT-4.1 предлагает увлекательную прозу и эмоциональные моменты, но опирается на более традиционные постапокалиптические тропы. Хотя стиль лиричен, рассказ кажется поспешным в развязке и не полностью исследует последствия своей предпосылки.

Превосходная концептуальная основа GLM-4.5, более продуманный темп и более глубокая тематическая проработка делают его в целом более сильным творческим произведением.

3. Задача по маркетинговому тексту: GLM-4.5 против GPT-4.1

Маркетинговое бриф

Создайте маркетинговый текст для «ZenFlow» — нового приложения для продуктивности, которое сочетает управление задачами на базе ИИ с техниками осознанности. Приложение помогает пользователям расставлять приоритеты задач, одновременно снижая стресс на рабочем месте с помощью встроенных перерывов на медитацию и сессий фокусировки.

Целевая аудитория: Работающие профессионалы в возрасте 25–40 лет, которые борются с балансом между работой и личной жизнью Ключевые функции: Приоритизация задач с помощью ИИ, перерывы на направленную медитацию, таймеры фокусировки, отслеживание стресса Тон: Профессиональный, но доступный, подчёркивающий как продуктивность, так и благополучие Формат: Напишите как 50-словную рекламу для соцсетей, так и 150-словное описание продукта для магазина приложений

Критерии оценки (всего 10 баллов):

Критерий Баллы Описание
Нацеленность на аудиторию (2 балла) 2 Чёткое понимание целевой демографической группы, обращение к конкретным болевым точкам
1 Общее понимание аудитории, некоторые релевантные сообщения
0 Плохая нацеленность на аудиторию, общие сообщения
Голос бренда и тон (2 балла) 2 Последовательный профессиональный, но доступный тон, аутентичная индивидуальность бренда
1 В основном соответствующий тон с незначительными несоответствиями
0 Неуместный или непоследовательный тон
Интеграция ключевых функций (2 балла) 2 Безупречное включение всех ключевых функций в убедительное повествование
1 Упоминает большинство функций, но интеграция кажется натянутой
0 Плохая интеграция функций или отсутствие ключевых элементов
Убедительное воздействие (2 балла) 2 Сильный призыв к действию, убедительное ценностное предложение, эмоциональная привлекательность
1 Адекватные убедительные элементы, некоторая эмоциональная связь
0 Слабое убеждение, неясное ценностное предложение
Соответствие формату (1 балл) 1 Соответствует требованиям по количеству слов, правильное форматирование для каждого носителя
0.5 Незначительные проблемы с форматом, небольшое отклонение от количества слов
0 Серьёзные проблемы с форматом, значительные ошибки в количестве слов
Ясность и вовлечение (1 балл) 1 Ясный, увлекательный текст, который хорошо читается и удерживает внимание
0.5 В целом ясно с незначительными проблемами вовлечения
0 Запутанный или скучный текст, плохая читаемость

Дополнительные примечания к оценке:

  • Оцените, насколько хорошо каждая модель балансирует сообщения о продуктивности и благополучии
  • Учитывайте эффективность языковых решений для целевой демографической группы
  • Оцените аутентичность и достоверность утверждений о благополучии
  • Ищите креативные, но профессиональные подходы к выделению на переполненном рынке приложений

GLM-4.5

Marketing Copy Challenge:  GLM-4.5

ChatGPT-4.1

Marketing Copy Challenge:  GLM-4.5 vs GPT-4.1

Анализ текста и оценка

Критерий GLM-4.5 GPT-4.1 Баллы
Нацеленность на аудиторию (2 балла) Обращается к «занятым профессионалам», упоминает проблемы баланса работы и жизни Чёткий фокус на «занятых профессионалах», релевантные болевые точки, такие как выгорание GLM-4.5: 2/2
GPT-4.1: 2/2
Голос бренда и тон (2 балла) Профессиональная терминология, изысканный язык, сохраняет последовательность Разговорный, но профессиональный, доступный язык на протяжении всего текста GLM-4.5: 1.5/2
GPT-4.1: 2/2
Интеграция ключевых функций (2 балла) Безупречно вплетает все функции в естественный поток, отличная техническая детализация Включает все функции естественно, хороший баланс технологий и благополучия GLM-4.5: 2/2
GPT-4.1: 2/2
Убедительное воздействие (2 балла) Сильное ценностное предложение, логическая привлекательность, изысканные сообщения Эмоциональные крючки («раскройте свой лучший рабочий день»), социальное доказательство, убедительный CTA GLM-4.5: 1.5/2
GPT-4.1: 2/2
Соответствие формату (1 балл) Ровно 50 и 150 слов, идеальное форматирование для каждого носителя Ровно 50 и 150 слов, соответствующее форматирование GLM-4.5: 1/1
GPT-4.1: 1/1
Ясность и вовлечение (1 балл) Понятно и информативно, но несколько плотно, профессиональный поток Высокая вовлечённость, энергичный язык, отличная читаемость GLM-4.5: 0.5/1
GPT-4.1: 1/1

Итоговые баллы

  • GLM-4.5: 8/10 баллов
  • GPT-4.1: 10/10 баллов

Сводная оценка

GPT-4.1 предоставляет превосходный маркетинговый текст с исключительной эмоциональной привлекательностью и вовлечённостью. Использование динамичных фраз, таких как «раскройте свой лучший рабочий день» и «ваш самый сбалансированный и продуктивный я — всего в одном нажатии», создаёт более сильную эмоциональную связь. Включение социального доказательства («присоединяйтесь к тысячам профессионалов») и разговорный тон делают текст более убедительным для целевой аудитории.

GLM-4.5 предоставляет технически изысканный текст с отличной интеграцией функций и профессиональной подачей. Язык точен и информативен, особенно силён в объяснении технических возможностей. Однако текст кажется несколько формальным и не хватает эмоциональных крючков и срочности, которые обеспечивают конверсию на конкурентных рынках приложений.

Как получить доступ к GLM-4.5 на Novita AI

Шаг 1: Войдите и перейдите в библиотеку моделей

Войдите в свою учётную запись и нажмите кнопку Model Library.

Model Library

Попробуйте бесплатно!

Шаг 2: Выберите свою модель

Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Choose Your Model

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

choose your model

Шаг 4: Получите свой API-ключ

Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу «Settings» и скопируйте API-ключ, как показано на изображении.

get api key

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, специфичного для вашего языка программирования.

install api

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Пример использования API chat completions для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<ваш API-ключ>",
)

model = "zai-org/glm-4.5"
stream = True # или False
max_tokens = 65536
system_content = "Будьте полезным ассистентом"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Привет!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Обе модели демонстрируют различные архитектурные философии и профили возможностей: GLM-4.5 превосходит в систематическом рассуждении и технических инновациях, в то время как ChatGPT-4.1 демонстрирует превосходную языковую беглость и вовлечённость пользователей. Это представляет собой взаимодополняющие подходы к разработке продвинутых систем ИИ, а не прямые конкурентные альтернативы.

GLM-4.5 — это фундаментальная модель с 355 миллиардами параметров, специально разработанная для приложений интеллектуальных агентов, с уникальной гибридной архитектурой рассуждения и двумя режимами работы. Имея 32 миллиарда активных параметров и контекстное окно на 128K токенов, модель объединяет возможности рассуждения, программирования и агентов под лицензией с открытым исходным кодом MIT. Её отличительная архитектура с режимами мышления/без мышления позволяет как сложное обдуманное рассуждение, так и быструю генерацию ответов, что позиционирует её как специализированное решение для сценариев развёртывания корпоративных агентов.

Попробуйте GLM-4.5 бесплатно!

Часто задаваемые вопросы

Что означает аббревиатура GLM?

GLM расшифровывается как «General Language Model» (Общая языковая модель). Это семейство больших языковых моделей, разработанных Zhipu AI, которые подчёркивают универсальные возможности понимания и генерации естественного языка.

Является ли GPT-4.1 «мыслящей» моделью?

GPT-4.1 не является «мыслящей» моделью в человеческом смысле. Она предсказывает ответы, а не «думает» в буквальном смысле.

Как подогнать модель GLM под свои задачи?

Модели GLM можно развернуть через официальные API на платформах, таких как Novita AI. Конкретные инструкции по настройке различаются в зависимости от версии модели и требований к оборудованию.

О Novita AI
Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надёжное GPU-облако для построения и масштабирования.