GPT-OSS-120B против GLM-4.5: Практичность или системность

GPT-OSS-120B против GLM-4.5: Практичность или системность

Ключевые особенности

GPT-OSS-120B: 117-параметрическая открытая модель MoE от OpenAI, разработанная для корпоративного анализа и промышленного развертывания с производительностью, близкой к o4-mini.

GLM-4.5: Фундаментальная модель, объединяющая возможности анализа, написания кода и работы интеллектуальных агентов, для удовлетворения сложных требований приложений с интеллектуальными агентами.

Novita AI не только предоставляет стабильные API-сервисы, но и предлагает крайне выгодные тарифы. Например, GPT-OSS-120B стоит $0,1 за 1 млн входных токенов и $0,5 за 1 млн выходных токенов, в то время как GLM-4.5 стоит $0,6 за 1 млн входных и $2,2 за 1 млн выходных токенов.

Базовая информация о моделях

GPT-OSS-120B

gpt-oss-120B — это открытая языковая модель смеси экспертов (MoE) от OpenAI, ориентированная на мощный анализ, агентные приложения и масштабируемое развертывание. Она создана как для высокопроизводительного корпоративного использования, так и для разработчиков, достигая производительности, близкой к модели o4-mini от OpenAI на ключевых бенчмарках анализа, при этом оставаясь экономически эффективной и доступной.

  • Параметры: 117 млрд общих параметров, из которых 5,1 млрд активных на шаг вывода.
  • Архитектура: Конструкция смеси экспертов с 128 экспертами на 36 слоях, использующая активации SwiGLU. Эффективная система маршрутизации экспертов активирует только наиболее релевантное подмножество экспертов для каждого токена, что позволяет повысить специализацию и эффективность. Имеет изученные приемники внимания для каждой головы внимания для улучшения производительности.
  • Контекстное окно: Поддерживает контекстное окно в 128К токенов, что позволяет выполнять длинный анализ, многоходовые диалоги и работу с большими документами или кодовыми базами.
  • Агентные возможности: Встроенная поддержка вызова функций, веб-поиска, выполнения кода на Python и структурированных выводов, что делает модель подходящей для создания интеллектуальных агентов. Совместима с форматами API ответов OpenAI и может быть дообучена для пользовательских сценариев использования.

GLM-4.5

GLM-4.5 — это фундаментальная модель, разработанная для интеллектуальных агентов с 355 млрд общих параметров и 32 млрд активных параметров. Модель объединяет возможности анализа, написания кода и работы интеллектуальных агентов для удовлетворения сложных требований приложений с интеллектуальными агентами. GLM-4.5 является гибридной моделью анализа, которая предоставляет два режима: режим мышления для сложного анализа и использования инструментов, а также режим без мышления для немедленных ответов.

Ключевые особенности и архитектура

  • Параметры: 355 млрд общих параметров, из которых 32 млрд активных.
  • Гибридный анализ: Два рабочих режима — режим мышления для сложного анализа и использования инструментов, а также режим без мышления для немедленных ответов.
  • Версии модели: Доступны базовые модели, гибридные модели анализа и версии FP8.
  • Контекстное окно: 128К токенов.
  • Лицензирование: Открытая лицензия MIT для коммерческого использования и доработки.
  • Возможности: Объединенные функции анализа, написания кода и работы интеллектуальных агентов для сложных приложений.

Сравнение бенчмарков GPT-OSS-120B и GLM-4.5

1. Бенчмарки интеллекта

2. Контекстное окно:

GPT OSS 120B: 128К токенов

GLM-4.5: 128К токенов

3. Тарифы API:

GPT OSS 120B: $0,1 / $0,5 за 1 млн токенов (вход/выход)

GLM-4.5: $0,6 / $2,2 за 1 млн токенов (вход/выход)

Практические тесты навыков GPT-OSS-120B и GLM-4.5

1. GPT-OSS-120B против GLM-4.5: Какая модель лучше подходит для генерации кода?

Описание задачи: Реализуйте класс Python SmartQueue со следующим функционалом:

  1. Поддержка операций очереди с приоритетом (меньшие числа = более высокий приоритет)
  2. Поддержка пакетных операций (добавление/удаление нескольких элементов одновременно)
  3. Реализация интеллектуального метода auto_process(), который автоматически обрабатывает N элементов с наивысшим приоритетом
  4. Включение базового отслеживания статистики (общее количество обработанных элементов, текущий размер очереди)

Требования к реализации:

# Пример ожидаемого использования:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats())  # Возвращает словарь со статистикой
processed = queue.auto_process(count=2)  # Обрабатывает 2 задачи с наивысшим приоритетом
print(processed)  # Возвращает список обработанных задач

Критерии оценки:

  • Выбор структуры данных: Используются ли подходящие структуры данных (например, heapq)
  • Дизайн API: Корректность названий методов и проектирования параметров
  • Обработка ошибок: Обработка крайних случаев (пустая очередь, неверные параметры и т.д.)
  • Организация кода: Структура класса и логика реализации методов
  • Идиомы Python: Использование специфических возможностей и соглашений Python
  • Эффективность алгоритма: Учет временной сложности операций

Дополнительное задание: Метод auto_process() должен возвращать обработанные элементы в осмысленном формате и обновлять внутреннюю статистику.

GPT-OSS-120B

Задача по программированию для GPT OSS 120B

GLM 4.5

Задача по программированию для GLM 4.5

GLM 4.5: Подходит для обучения и простых прототипов, требует оптимизации для промышленного использования

GPT OSS 120B: Готов к использованию в профессиональных проектах, соответствует промышленным стандартам качества кода

Попробуйте GPT-OSS-120B и GLM-4.5 самостоятельно!

2. Как GLM-4.5 обрабатывает неоднозначные запросы по сравнению с GPT-OSS-120B?

Промпт: «Банк позвонил по поводу чека. Его было недостаточно.»

Это предложение содержит несколько неоднозначностей. Пожалуйста:

  1. Определите все возможные интерпретации этого предложения
  2. Ранжируйте эти интерпретации по вероятности в современном контексте
  3. Объясните ваш процесс рассуждений для устранения неоднозначности
  4. Если вам потребовался бы дополнительный контекст для уверенности, какие конкретные вопросы вы бы задали?
  5. Предоставьте ответ, как если бы вы помогали кому-то понять, что, скорее всего, произошло

Четко опишите ваш процесс рассуждений и все допущения, которые вы делаете.

GPT-OSS-120B

Неоднозначные запросы к GPT OSS 120B

GLM 4.5

Неоднозначные запросы к GLM 4.5

GPT-OSS-120B продемонстрировал превосходную аналитическую глубину и системное рассуждение, в то время как GLM-4.5 показал лучшее практическое суждение в балансе между полнотой и удобством использования.

GPT-OSS-120B превосходно справляется с исчерпывающим устранением неоднозначности, в то время как GLM-4.5 отдает приоритет ясности и практическим рекомендациям.

Как получить доступ к GPT-OSS-120B и GLM-4.5 на Novita AI

Шаг 1: Войдите в аккаунт и перейдите в библиотеку моделей

Войдите в свой аккаунт и нажмите кнопку Библиотека моделей.

Библиотека моделей

Попробуйте GPT-OSS-120B и GLM-4.5 прямо сейчас!

Шаг 2: Выберите нужную модель

Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Выберите модель

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

Выберите модель

Шаг 4: Получите ваш API-ключ

Для аутентификации через API мы предоставим вам новый API-ключ. Перейдя на страницу «Настройки», вы можете скопировать API-ключ, как показано на изображении.

Получение API-ключа

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

Установка API

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с LLM Novita AI. Это пример использования API завершения чата для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

GPT-OSS-120B выделяется как решение, готовое к промышленному использованию, обеспечивая всестороннюю аналитическую глубину и системное рассуждение, соответствующие промышленным стандартам качества кода. Его исчерпывающий подход к решению проблем делает его подходящим для профессиональных проектов, требующих подробной документации и строгого анализа.

GLM-4.5 превосходно подходит как инструмент для разработки и прототипирования, предлагая практические, ориентированные на пользователя ответы с оптимизированным рассуждением. Он балансирует между полнотой и удобством использования, что делает его идеальным для учебных сред и быстрого прототипирования.

Часто задаваемые вопросы

Что такое GPT-OSS-120B?

GPT-OSS-120B — это 117-параметрическая открытая модель MoE от OpenAI, разработанная для корпоративного анализа и промышленного развертывания с производительностью, близкой к o4-mini.

Как дообучить модель GLM?

Модели GLM можно развертывать через официальные API-платформы, такие как Novita AI, при этом конкретные инструкции по настройке варьируются в зависимости от версии модели и требований к оборудованию.

Является ли GPT-4o открытым исходным кодом?

Нет, но GPT-OSS-120B имеет открытый исходный код и производительность, сравнимую с GPT-4o, и может использоваться на Novita AI.

О Novita AI
Novita AI — это облачная платформа ИИ, которая предлагает разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предоставляет доступное и надежное облако GPU для создания и масштабирования решений.