Как получить доступ к Qwen 3 локально или через API: полное руководство

Содержание

Что такое Qwen 3?
Архитектура серии Qwen 3
Бенчмарки серии Qwen 3
Как получить доступ к Qwen 3 локально?
Как получить доступ к Qwen 3 через API
Какие методы подходят вам?

Порекомендуйте друзьям Novita AI — и вы оба получите по 10 $ в виде кредитов на LLM API — до 500 $ суммарного вознаграждения.

В поддержку сообщества разработчиков модели Qwen2.5-7B, Qwen 3 0.6B, Qwen 3 1.7B, Qwen 3 4B сейчас доступны бесплатно на Novita AI.

Qwen 3 — это универсальное и мощное семейство открытых языковых моделей, созданное Alibaba. Благодаря передовой архитектуре и двум режимам рассуждения оно подходит как для периферийных устройств, так и для крупных корпоративных задач. В этой статье мы рассмотрим его возможности, типы моделей и способы использования — локально или через API.

Что такое Qwen 3?

Qwen 3 — это семейство открытых больших языковых моделей Alibaba 2025 года с переключаемыми режимами «мышления» и «без мышления», что обеспечивает улучшенное рассуждение и многоязычную производительность на 119+ языках. Линейка моделей Qwen 3 включает:

Плотные модели:
Модели на основе смеси экспертов (MoE):
- Qwen 3 30B A3B
- Qwen 3 235B A22B

Открытый исходный код и коммерческое использование

Лицензия Apache 2.0, веса свободно доступны для исследований и коммерческого применения. ### Эффективное ядро Transformer

Decoder-only с Grouped-Query-Attention для экономии памяти KV при длинном контексте до 128 K токенов. ### Двойные режимы «мышления / без мышления»

Подробная цепочка рассуждений, когда это нужно, и быстрые прямые ответы, когда важна скорость. ### Огромный корпус из 36 T токенов

119 языков с расширенными данными по STEM и коду для более сильных навыков рассуждения и программирования. ### Трёхэтапное предобучение

Базовые навыки → обогащение STEM → адаптация к длинному контексту в 32 K токена. ### Четырёхэтапное пост-обучение

Длинная цепочка рассуждений (SFT) → RL на рассуждениях → слияние режимов → общая RLHF-калибровка. ### Многоязычное следование инструкциям

Сильные стороны в английском и китайском, надёжная работа на 100+ языках для глобальных приложений. ### Готовность к инструментам / агентам

Встроенная схема вызова функций для определения и форматирования вызовов внешних инструментов. ### Модальность текст-на-вход / текст-на-выход

Сегодня оптимизирована для языковых задач; в будущих релизах планируются варианты с поддержкой зрения.

Архитектура серии Qwen 3

Бенчмарки серии Qwen 3

Модели с большим количеством параметров, такие как Qwen-23B и Qwen-14B, стабильно следуют правилам, причём более крупные модели и версии с включённым рассуждением набирают больше очков. Эти расхождения в моделях с малым количеством параметров могут быть связаны с ограничениями их способности к рассуждению: им не хватает вычислительной мощности, чтобы полностью использовать механизмы рассуждения, что приводит к неоптимальной производительности.