GLM-4.5 против ChatGPT-4.1: Системность или выразительность

Содержание

Основное описание модели
Сравнение бенчмарков
Тестирование прикладных навыков GLM-4.5 и GPT-4.1
Как получить доступ к GLM-4.5 на Novita AI
Часто задаваемые вопросы

Ключевые моменты

GLM-4.5 — фундаментальная модель, объединяющая возможности рассуждения, программирования и интеллектуальных агентов для удовлетворения сложных требований приложений на основе агентов.

ChatGPT-4.1 — мультимодальная фундаментальная модель с продвинутыми способностями к рассуждению, оптимизированная для универсального решения задач и человекоподобного общения в различных областях и приложениях.

Novita AI не только предоставляет стабильные API-сервисы, но и предлагает чрезвычайно выгодные цены. Например, GLM-4.5 стоит $0.6 за 1M входных токенов и $2.2 за 1M выходных токенов.

Основное описание модели

GLM-4.5

GLM-4.5 — это фундаментальная модель, предназначенная для интеллектуальных агентов, с общим количеством параметров 355 миллиардов и 32 миллиардами активных параметров. Модель объединяет возможности рассуждения, программирования и агентов для удовлетворения сложных требований приложений на основе агентов. GLM-4.5 — это гибридная модель рассуждений, которая предоставляет два режима: режим мышления для сложных рассуждений и использования инструментов, и режим без размышлений для немедленных ответов.

Ключевые особенности и архитектура

Параметры: 355 миллиардов всего, 32 миллиарда активных.
Гибридное рассуждение: Два режима работы — режим мышления для сложных рассуждений и использования инструментов, и режим без размышлений для немедленных ответов.
Версии модели: Доступны в виде базовых моделей, гибридных моделей рассуждения и версий FP8.
Контекстное окно: 128K токенов.
Лицензия: Открытая лицензия MIT для коммерческого использования и вторичной разработки.
Возможности: Объединённые функции рассуждения, программирования и интеллектуальных агентов для сложных приложений.

ChatGPT-4.1

ChatGPT-4.1, выпущенный 14 апреля 2025 года компанией OpenAI, предлагает прорывные улучшения в понимании контекста с родным контекстным окном в 1 миллион токенов, на 21% улучшенные возможности программирования по сравнению с GPT-4o и превосходную мультимодальную обработку текста, изображений и документов. Построенный на оптимизированной архитектуре трансформера с улучшенными механизмами внимания, ChatGPT-4.1 достигает передовых результатов в академических бенчмарках AIME, GPQA, MMLU, оценках программирования SWE-bench и задачах зрения MMMU/MathVista.

Ключевые особенности и архитектура

Тип: Продвинутая большая языковая модель с мультимодальными возможностями
Дата выпуска: 14 апреля 2025 года
Контекстное окно: 1M токенов нативно
Производительность в программировании: Улучшение на 21% в возможностях программной инженерии по сравнению с GPT-4o
Мультимодальная поддержка: Расширенные возможности анализа текста, изображений и документов
Следование инструкциям: Продвинутое соблюдение требований пользователя к форматированию и задачам

Сравнение бенчмарков

1. Бенчмарки интеллекта

2. Контекстное окно:

GLM-4.5: 128k токенов

ChatGPT-4.1: 1M токенов

3. Цены API:

GLM-4.5: $0.6 / $2.2 вход/выход за 1M токенов

ChatGPT-4.1: $2 / $8 вход/выход за 1M токенов

Тестирование прикладных навыков GLM-4.5 и GPT-4.1

1. Задача по программированию: GLM-4.5 против GPT-4.1

Промпт:

Реализуйте функцию для объединения перекрывающихся интервалов и возврата результата, отсортированного по времени начала.

Входные данные: список интервалов в виде кортежей [(start, end), …]
Выходные данные: список объединённых интервалов
Ограничение: обработайте граничные случаи и оптимизируйте для читаемости

Пример:
intervals = [(1,3), (2,6), (8,10), (15,18)]
Ожидаемый результат: [(1,6), (8,10), (15,18)]

intervals = [(1,4), (4,5)]
Ожидаемый результат: [(1,5)]

Критерии оценки (10 баллов):

Корректность алгоритма (4 балла): Правильное объединение перекрывающихся интервалов, обработка граничных случаев (пустой список, один интервал, касающиеся интервалы)
Эффективность кода (3 балла): Оптимальный подход (сначала сортировка, затем объединение за один проход), чистая логика
Качество кода (2 балла): Читаемые имена переменных, правильная структура, проверка входных данных
Обработка граничных случаев (1 балл): Явная обработка особых случаев, таких как пустой ввод, один интервал и т.д.

GLM-4.5

ChatGPT-4.1

Анализ кода и оценка

Критерий	GPT-4.1	GLM-4.5	Баллы
Корректность алгоритма (4 балла)	Правильная логика объединения, обрабатывает все граничные случаи	Правильная логика объединения, обрабатывает все граничные случаи	GPT-4.1: 4/4 GLM-4.5: 4/4
Эффективность кода (3 балла)	Оптимальный подход O(n log n), чистый однопроходный merge	Оптимальный подход O(n log n), чистый однопроходный merge	GPT-4.1: 3/3 GLM-4.5: 3/3
Качество кода (2 балла)	Понятные имена переменных, встроенные комментарии, хорошая структура	Чистая структура, но нет встроенных комментариев	GPT-4.1: 2/2 GLM-4.5: 1.5/2
Обработка граничных случаев (1 балл)	Явно документирует 5 граничных случаев с примерами	Упоминает граничные случаи, но менее явная документация	GPT-4.1: 1/1 GLM-4.5: 0.5/1

Итоговые баллы

GPT-4.1: 10/10 баллов
GLM-4.5: 9/10 баллов

Обе модели дают алгоритмически корректные и эффективные решения. GPT-4.1 вырывается вперёд за счёт превосходной практики документирования — встроенные комментарии и явное перечисление граничных случаев с примерами. GLM-4.5 предлагает отличное объяснение алгоритма и чистую структуру кода, но не хватает всесторонней документации, которая делает код готовым к производству. Оценка отражает объективные различия в стандартах документирования кода, а не в алгоритмических способностях.

2. Задача по креативному письму: GLM-4.5 против GPT-4.1

Промпт

Напишите короткий рассказ (300–500 слов) под названием «Последняя библиотека на Земле». Действие должно происходить в постапокалиптическом мире, где физические книги вымерли, кроме одной скрытой библиотеки. Ваш главный герой обнаруживает эту библиотеку и должен принять решающее решение о её судьбе. Включите в повествование элементы как надежды, так и утраты.

Критерии оценки (10 баллов):

Критерий	Баллы	Описание
Креативность и оригинальность (3 балла)	3	Уникальные сюжетные элементы, инновационное построение мира, оригинальные концепции персонажей
	2	Некоторые креативные элементы, неплохое построение мира, стандартная проработка персонажей
	1	Базовая креативность, минимальная оригинальность, предсказуемые элементы
Структура повествования (2 балла)	2	Хорошо выдержанный ритм рассказа с чётким началом/серединой/концом, плавные переходы
	1	Адекватная структура с некоторыми проблемами темпа
	0	Слабая структура, неясное развитие
Развитие персонажа (2 балла)	2	Захватывающий главный герой с чёткими мотивациями и эмоциональной глубиной
	1	Базовая проработка персонажа, некоторая эмоциональная связь
	0	Слабая характеристика, неясные мотивации
Интеграция темы (2 балла)	2	Искусно балансирует надежду и утрату, осмысленное исследование тем
	1	Адекватные тематические элементы, некоторый баланс достигнут
	0	Плохая интеграция темы, несбалансированные или неясные темы
Язык и стиль (1 балл)	1	Увлекательная проза, соответствующий тон, эффективный выбор слов
	0.5	Адекватный стиль письма с незначительными проблемами
	0	Плохое использование языка, неуместный тон, неясное выражение

Дополнительные примечания к оценке:

Рассказы должны укладываться в лимит 300–500 слов
Учитывайте эмоциональное воздействие и вовлечённость читателя
Оцените, насколько хорошо ИИ справляется с конкретными ограничениями промпта
Ищите согласованность между названием и содержанием рассказа

GLM-4.5

ChatGPT-4.1

Анализ рассказа и оценка

Критерий	GLM-4.5	GPT-4.1	Баллы
Креативность и оригинальность (3 балла)	Концепция «Войны данных», нейронные сети против книг, инновационный технологический фон	Традиционная постапокалиптическая обстановка со знакомыми элементами	GLM-4.5: 3/3 GPT-4.1: 2/3
Структура повествования (2 балла)	Хорошо выдержанная семидневная арка, чёткое развитие решения, удовлетворительная развязка	Хорошая структура, но поспешная концовка, быстрое решение	GLM-4.5: 2/2 GPT-4.1: 1.5/2
Развитие персонажа (2 балла)	Элиас проявляет вдумчивое созерцание, значительный рост персонажа	У Мары есть эмоциональные моменты, но меньше глубины проработки	GLM-4.5: 2/2 GPT-4.1: 1.5/2
Интеграция темы (2 балла)	Утончённое исследование сохранения знаний, метафора строительства моста	Сильный баланс надежды/утраты, но более поверхностная тематическая проработка	GLM-4.5: 2/2 GPT-4.1: 1.5/2
Язык и стиль (1 балл)	Чистая, целенаправленная проза с эффективным построением мира	Выразительные образы, но иногда чрезмерно вычурные описания	GLM-4.5: 1/1 GPT-4.1: 0.5/1

Итоговые баллы

GLM-4.5: 10/10 баллов
GPT-4.1: 8.5/10 баллов

GLM-4.5 представляет более интеллектуально сложное повествование с превосходным построением мира и тематической глубиной. Концепция «Войны данных» и общество нейронных сетей создают по-настоящему инновационный фон, а семидневные размышления Элиаса демонстрируют значительное развитие персонажа. Метафора строительства моста между старыми и новыми системами знаний демонстрирует утончённую интеграцию тем.

GPT-4.1 предлагает увлекательную прозу и эмоциональные моменты, но опирается на более традиционные постапокалиптические тропы. Хотя стиль лиричен, рассказ кажется поспешным в развязке и не полностью исследует последствия своей предпосылки.

Превосходная концептуальная основа GLM-4.5, более продуманный темп и более глубокая тематическая проработка делают его в целом более сильным творческим произведением.

3. Задача по маркетинговому тексту: GLM-4.5 против GPT-4.1

Маркетинговое бриф

Создайте маркетинговый текст для «ZenFlow» — нового приложения для продуктивности, которое сочетает управление задачами на базе ИИ с техниками осознанности. Приложение помогает пользователям расставлять приоритеты задач, одновременно снижая стресс на рабочем месте с помощью встроенных перерывов на медитацию и сессий фокусировки.

Целевая аудитория: Работающие профессионалы в возрасте 25–40 лет, которые борются с балансом между работой и личной жизнью Ключевые функции: Приоритизация задач с помощью ИИ, перерывы на направленную медитацию, таймеры фокусировки, отслеживание стресса Тон: Профессиональный, но доступный, подчёркивающий как продуктивность, так и благополучие Формат: Напишите как 50-словную рекламу для соцсетей, так и 150-словное описание продукта для магазина приложений

Критерии оценки (всего 10 баллов):

Критерий	Баллы	Описание
Нацеленность на аудиторию (2 балла)	2	Чёткое понимание целевой демографической группы, обращение к конкретным болевым точкам
	1	Общее понимание аудитории, некоторые релевантные сообщения
	0	Плохая нацеленность на аудиторию, общие сообщения
Голос бренда и тон (2 балла)	2	Последовательный профессиональный, но доступный тон, аутентичная индивидуальность бренда
	1	В основном соответствующий тон с незначительными несоответствиями
	0	Неуместный или непоследовательный тон
Интеграция ключевых функций (2 балла)	2	Безупречное включение всех ключевых функций в убедительное повествование
	1	Упоминает большинство функций, но интеграция кажется натянутой
	0	Плохая интеграция функций или отсутствие ключевых элементов
Убедительное воздействие (2 балла)	2	Сильный призыв к действию, убедительное ценностное предложение, эмоциональная привлекательность
	1	Адекватные убедительные элементы, некоторая эмоциональная связь
	0	Слабое убеждение, неясное ценностное предложение
Соответствие формату (1 балл)	1	Соответствует требованиям по количеству слов, правильное форматирование для каждого носителя
	0.5	Незначительные проблемы с форматом, небольшое отклонение от количества слов
	0	Серьёзные проблемы с форматом, значительные ошибки в количестве слов
Ясность и вовлечение (1 балл)	1	Ясный, увлекательный текст, который хорошо читается и удерживает внимание
	0.5	В целом ясно с незначительными проблемами вовлечения
	0	Запутанный или скучный текст, плохая читаемость

Дополнительные примечания к оценке:

Оцените, насколько хорошо каждая модель балансирует сообщения о продуктивности и благополучии
Учитывайте эффективность языковых решений для целевой демографической группы
Оцените аутентичность и достоверность утверждений о благополучии
Ищите креативные, но профессиональные подходы к выделению на переполненном рынке приложений

GLM-4.5

ChatGPT-4.1

Анализ текста и оценка

Критерий	GLM-4.5	GPT-4.1	Баллы
Нацеленность на аудиторию (2 балла)	Обращается к «занятым профессионалам», упоминает проблемы баланса работы и жизни	Чёткий фокус на «занятых профессионалах», релевантные болевые точки, такие как выгорание	GLM-4.5: 2/2 GPT-4.1: 2/2
Голос бренда и тон (2 балла)	Профессиональная терминология, изысканный язык, сохраняет последовательность	Разговорный, но профессиональный, доступный язык на протяжении всего текста	GLM-4.5: 1.5/2 GPT-4.1: 2/2
Интеграция ключевых функций (2 балла)	Безупречно вплетает все функции в естественный поток, отличная техническая детализация	Включает все функции естественно, хороший баланс технологий и благополучия	GLM-4.5: 2/2 GPT-4.1: 2/2
Убедительное воздействие (2 балла)	Сильное ценностное предложение, логическая привлекательность, изысканные сообщения	Эмоциональные крючки («раскройте свой лучший рабочий день»), социальное доказательство, убедительный CTA	GLM-4.5: 1.5/2 GPT-4.1: 2/2
Соответствие формату (1 балл)	Ровно 50 и 150 слов, идеальное форматирование для каждого носителя	Ровно 50 и 150 слов, соответствующее форматирование	GLM-4.5: 1/1 GPT-4.1: 1/1
Ясность и вовлечение (1 балл)	Понятно и информативно, но несколько плотно, профессиональный поток	Высокая вовлечённость, энергичный язык, отличная читаемость	GLM-4.5: 0.5/1 GPT-4.1: 1/1

Итоговые баллы

GLM-4.5: 8/10 баллов
GPT-4.1: 10/10 баллов

Сводная оценка

GPT-4.1 предоставляет превосходный маркетинговый текст с исключительной эмоциональной привлекательностью и вовлечённостью. Использование динамичных фраз, таких как «раскройте свой лучший рабочий день» и «ваш самый сбалансированный и продуктивный я — всего в одном нажатии», создаёт более сильную эмоциональную связь. Включение социального доказательства («присоединяйтесь к тысячам профессионалов») и разговорный тон делают текст более убедительным для целевой аудитории.

GLM-4.5 предоставляет технически изысканный текст с отличной интеграцией функций и профессиональной подачей. Язык точен и информативен, особенно силён в объяснении технических возможностей. Однако текст кажется несколько формальным и не хватает эмоциональных крючков и срочности, которые обеспечивают конверсию на конкурентных рынках приложений.

Как получить доступ к GLM-4.5 на Novita AI

Шаг 1: Войдите и перейдите в библиотеку моделей

Войдите в свою учётную запись и нажмите кнопку Model Library.

Попробуйте бесплатно!

Шаг 2: Выберите свою модель

Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

Шаг 4: Получите свой API-ключ

Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу «Settings» и скопируйте API-ключ, как показано на изображении.

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, специфичного для вашего языка программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Пример использования API chat completions для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<ваш API-ключ>",
)

model = "zai-org/glm-4.5"
stream = True # или False
max_tokens = 65536
system_content = "Будьте полезным ассистентом"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Привет!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Обе модели демонстрируют различные архитектурные философии и профили возможностей: GLM-4.5 превосходит в систематическом рассуждении и технических инновациях, в то время как ChatGPT-4.1 демонстрирует превосходную языковую беглость и вовлечённость пользователей. Это представляет собой взаимодополняющие подходы к разработке продвинутых систем ИИ, а не прямые конкурентные альтернативы.

GLM-4.5 — это фундаментальная модель с 355 миллиардами параметров, специально разработанная для приложений интеллектуальных агентов, с уникальной гибридной архитектурой рассуждения и двумя режимами работы. Имея 32 миллиарда активных параметров и контекстное окно на 128K токенов, модель объединяет возможности рассуждения, программирования и агентов под лицензией с открытым исходным кодом MIT. Её отличительная архитектура с режимами мышления/без мышления позволяет как сложное обдуманное рассуждение, так и быструю генерацию ответов, что позиционирует её как специализированное решение для сценариев развёртывания корпоративных агентов.

Попробуйте GLM-4.5 бесплатно!

Часто задаваемые вопросы

Что означает аббревиатура GLM?

GLM расшифровывается как «General Language Model» (Общая языковая модель). Это семейство больших языковых моделей, разработанных Zhipu AI, которые подчёркивают универсальные возможности понимания и генерации естественного языка.

Является ли GPT-4.1 «мыслящей» моделью?

GPT-4.1 не является «мыслящей» моделью в человеческом смысле. Она предсказывает ответы, а не «думает» в буквальном смысле.

Как подогнать модель GLM под свои задачи?

Модели GLM можно развернуть через официальные API на платформах, таких как Novita AI. Конкретные инструкции по настройке различаются в зависимости от версии модели и требований к оборудованию.

О Novita AI
Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надёжное GPU-облако для построения и масштабирования.

Ключевые моменты

Основное описание модели

GLM-4.5

Ключевые особенности и архитектура

ChatGPT-4.1

Ключевые особенности и архитектура

Сравнение бенчмарков

1. Бенчмарки интеллекта

2. Контекстное окно:

3. Цены API:

Тестирование прикладных навыков GLM-4.5 и GPT-4.1

1. Задача по программированию: GLM-4.5 против GPT-4.1

GLM-4.5

ChatGPT-4.1

Анализ кода и оценка

Итоговые баллы

2. Задача по креативному письму: GLM-4.5 против GPT-4.1

Дополнительные примечания к оценке:

GLM-4.5

ChatGPT-4.1

Анализ рассказа и оценка

Итоговые баллы

3. Задача по маркетинговому тексту: GLM-4.5 против GPT-4.1

Критерии оценки (всего 10 баллов):

Дополнительные примечания к оценке:

GLM-4.5

Анализ текста и оценка

Итоговые баллы

Сводная оценка

Как получить доступ к GLM-4.5 на Novita AI

Шаг 1: Войдите и перейдите в библиотеку моделей

Шаг 2: Выберите свою модель

Шаг 3: Начните бесплатный пробный период

Шаг 4: Получите свой API-ключ

Шаг 5: Установите API

Часто задаваемые вопросы

Похожие статьи

Product

RESOURCES

Partners

Company