Ключевые особенности
GPT-OSS-120B: 117-параметрическая открытая модель MoE от OpenAI, разработанная для корпоративного анализа и промышленного развертывания с производительностью, близкой к o4-mini.
GLM-4.5: Фундаментальная модель, объединяющая возможности анализа, написания кода и работы интеллектуальных агентов, для удовлетворения сложных требований приложений с интеллектуальными агентами.
Novita AI не только предоставляет стабильные API-сервисы, но и предлагает крайне выгодные тарифы. Например, GPT-OSS-120B стоит $0,1 за 1 млн входных токенов и $0,5 за 1 млн выходных токенов, в то время как GLM-4.5 стоит $0,6 за 1 млн входных и $2,2 за 1 млн выходных токенов.
Базовая информация о моделях
GPT-OSS-120B
gpt-oss-120B — это открытая языковая модель смеси экспертов (MoE) от OpenAI, ориентированная на мощный анализ, агентные приложения и масштабируемое развертывание. Она создана как для высокопроизводительного корпоративного использования, так и для разработчиков, достигая производительности, близкой к модели o4-mini от OpenAI на ключевых бенчмарках анализа, при этом оставаясь экономически эффективной и доступной.
- Параметры: 117 млрд общих параметров, из которых 5,1 млрд активных на шаг вывода.
- Архитектура: Конструкция смеси экспертов с 128 экспертами на 36 слоях, использующая активации SwiGLU. Эффективная система маршрутизации экспертов активирует только наиболее релевантное подмножество экспертов для каждого токена, что позволяет повысить специализацию и эффективность. Имеет изученные приемники внимания для каждой головы внимания для улучшения производительности.
- Контекстное окно: Поддерживает контекстное окно в 128К токенов, что позволяет выполнять длинный анализ, многоходовые диалоги и работу с большими документами или кодовыми базами.
- Агентные возможности: Встроенная поддержка вызова функций, веб-поиска, выполнения кода на Python и структурированных выводов, что делает модель подходящей для создания интеллектуальных агентов. Совместима с форматами API ответов OpenAI и может быть дообучена для пользовательских сценариев использования.
GLM-4.5
GLM-4.5 — это фундаментальная модель, разработанная для интеллектуальных агентов с 355 млрд общих параметров и 32 млрд активных параметров. Модель объединяет возможности анализа, написания кода и работы интеллектуальных агентов для удовлетворения сложных требований приложений с интеллектуальными агентами. GLM-4.5 является гибридной моделью анализа, которая предоставляет два режима: режим мышления для сложного анализа и использования инструментов, а также режим без мышления для немедленных ответов.
Ключевые особенности и архитектура
- Параметры: 355 млрд общих параметров, из которых 32 млрд активных.
- Гибридный анализ: Два рабочих режима — режим мышления для сложного анализа и использования инструментов, а также режим без мышления для немедленных ответов.
- Версии модели: Доступны базовые модели, гибридные модели анализа и версии FP8.
- Контекстное окно: 128К токенов.
- Лицензирование: Открытая лицензия MIT для коммерческого использования и доработки.
- Возможности: Объединенные функции анализа, написания кода и работы интеллектуальных агентов для сложных приложений.
Сравнение бенчмарков GPT-OSS-120B и GLM-4.5
1. Бенчмарки интеллекта

2. Контекстное окно:
GPT OSS 120B: 128К токенов
GLM-4.5: 128К токенов
3. Тарифы API:
GPT OSS 120B: $0,1 / $0,5 за 1 млн токенов (вход/выход)
GLM-4.5: $0,6 / $2,2 за 1 млн токенов (вход/выход)
Практические тесты навыков GPT-OSS-120B и GLM-4.5
1. GPT-OSS-120B против GLM-4.5: Какая модель лучше подходит для генерации кода?
Описание задачи: Реализуйте класс Python SmartQueue со следующим функционалом:
- Поддержка операций очереди с приоритетом (меньшие числа = более высокий приоритет)
- Поддержка пакетных операций (добавление/удаление нескольких элементов одновременно)
- Реализация интеллектуального метода
auto_process(), который автоматически обрабатывает N элементов с наивысшим приоритетом - Включение базового отслеживания статистики (общее количество обработанных элементов, текущий размер очереди)
Требования к реализации:
# Пример ожидаемого использования:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats()) # Возвращает словарь со статистикой
processed = queue.auto_process(count=2) # Обрабатывает 2 задачи с наивысшим приоритетом
print(processed) # Возвращает список обработанных задач
Критерии оценки:
- Выбор структуры данных: Используются ли подходящие структуры данных (например, heapq)
- Дизайн API: Корректность названий методов и проектирования параметров
- Обработка ошибок: Обработка крайних случаев (пустая очередь, неверные параметры и т.д.)
- Организация кода: Структура класса и логика реализации методов
- Идиомы Python: Использование специфических возможностей и соглашений Python
- Эффективность алгоритма: Учет временной сложности операций
Дополнительное задание: Метод auto_process() должен возвращать обработанные элементы в осмысленном формате и обновлять внутреннюю статистику.
GPT-OSS-120B

GLM 4.5

GLM 4.5: Подходит для обучения и простых прототипов, требует оптимизации для промышленного использования
GPT OSS 120B: Готов к использованию в профессиональных проектах, соответствует промышленным стандартам качества кода
Попробуйте GPT-OSS-120B и GLM-4.5 самостоятельно!
2. Как GLM-4.5 обрабатывает неоднозначные запросы по сравнению с GPT-OSS-120B?
Промпт: «Банк позвонил по поводу чека. Его было недостаточно.»
Это предложение содержит несколько неоднозначностей. Пожалуйста:
- Определите все возможные интерпретации этого предложения
- Ранжируйте эти интерпретации по вероятности в современном контексте
- Объясните ваш процесс рассуждений для устранения неоднозначности
- Если вам потребовался бы дополнительный контекст для уверенности, какие конкретные вопросы вы бы задали?
- Предоставьте ответ, как если бы вы помогали кому-то понять, что, скорее всего, произошло
Четко опишите ваш процесс рассуждений и все допущения, которые вы делаете.
GPT-OSS-120B

GLM 4.5

GPT-OSS-120B продемонстрировал превосходную аналитическую глубину и системное рассуждение, в то время как GLM-4.5 показал лучшее практическое суждение в балансе между полнотой и удобством использования.
GPT-OSS-120B превосходно справляется с исчерпывающим устранением неоднозначности, в то время как GLM-4.5 отдает приоритет ясности и практическим рекомендациям.
Как получить доступ к GPT-OSS-120B и GLM-4.5 на Novita AI
Шаг 1: Войдите в аккаунт и перейдите в библиотеку моделей
Войдите в свой аккаунт и нажмите кнопку Библиотека моделей.

Попробуйте GPT-OSS-120B и GLM-4.5 прямо сейчас!
Шаг 2: Выберите нужную модель
Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Шаг 3: Начните бесплатный пробный период
Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

Шаг 4: Получите ваш API-ключ
Для аутентификации через API мы предоставим вам новый API-ключ. Перейдя на страницу «Настройки», вы можете скопировать API-ключ, как показано на изображении.

Шаг 5: Установите API
Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с LLM Novita AI. Это пример использования API завершения чата для пользователей Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
GPT-OSS-120B выделяется как решение, готовое к промышленному использованию, обеспечивая всестороннюю аналитическую глубину и системное рассуждение, соответствующие промышленным стандартам качества кода. Его исчерпывающий подход к решению проблем делает его подходящим для профессиональных проектов, требующих подробной документации и строгого анализа.
GLM-4.5 превосходно подходит как инструмент для разработки и прототипирования, предлагая практические, ориентированные на пользователя ответы с оптимизированным рассуждением. Он балансирует между полнотой и удобством использования, что делает его идеальным для учебных сред и быстрого прототипирования.
Часто задаваемые вопросы
Что такое GPT-OSS-120B?
GPT-OSS-120B — это 117-параметрическая открытая модель MoE от OpenAI, разработанная для корпоративного анализа и промышленного развертывания с производительностью, близкой к o4-mini.
Как дообучить модель GLM?
Модели GLM можно развертывать через официальные API-платформы, такие как Novita AI, при этом конкретные инструкции по настройке варьируются в зависимости от версии модели и требований к оборудованию.
Является ли GPT-4o открытым исходным кодом?
Нет, но GPT-OSS-120B имеет открытый исходный код и производительность, сравнимую с GPT-4o, и может использоваться на Novita AI.
О Novita AI
Novita AI — это облачная платформа ИИ, которая предлагает разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предоставляет доступное и надежное облако GPU для создания и масштабирования решений.
