Разработчики, изучающие мощные языковые модели с открытыми весами, часто сталкиваются с общим вопросом: как вообще начать использовать эту модель? У Qwen3.5-397B-A17B есть три отдельных пути доступа: мгновенный веб-чат для тестирования, управляемые API для производственных приложений и самостоятельное развертывание для полного контроля. Каждый метод подходит для разных сценариев — от быстрого прототипирования до вывода на уровень предприятия.
В этом руководстве рассматриваются все способы доступа с инструкциями по настройке, реальными данными о тарифах и требованиями к оборудованию. Вы узнаете, какой путь подходит для вашего сценария использования, и как начать работу за несколько минут.
Что такое Qwen3.5-397B-A17B?
Qwen3.5-397B-A17B — это флагманская языковая модель с открытыми весами от Alibaba Cloud, архитектура которой представляет собой смесь экспертов (MoE, Mixture-of-Experts), с общим количеством параметров 403 миллиарда и 17 миллиардами активных параметров на токен. Модель поддерживает контекст длиной 262 144 токена (окно контекста 256k) и имеет встроенную поддержку мультимодальных входных данных, включая текст и изображения. Согласно бенчмаркам от Artificial Analysis, у Qwen3.5-397B-A17B показатель GDPval-AA ELO составляет 1221, что на 361 пункт выше, чем у предыдущей модели Qwen3 235B (860). Модель особенно сильна в задачах программирования, рассуждений и работы с агентами, при этом сохраняет экономическую эффективность за счет архитектуры MoE.

Источник: Artificial Analysis
Обзор бенчмарков Qwen3.5-397B-A17B
| Категория | Бенчмарк | Результат | Лидирующая модель |
|---|---|---|---|
| Следование инструкциям | IFBench | 76.5 | Qwen3.5 |
| Сложные задачи | MultiChallenge | 67.6 | Qwen3.5 |
| Агенты / браузинг | BrowseComp | 78.6 | Qwen3.5 |
| Научное рассуждение | GPQA Diamond | 88.4 | Qwen3.5 (открытые модели) |
| Знания | MMLU-Pro | 87.8 | Gemini |
| Знания | MMLU-Redux | 94.9 | Gemini |
| Знания | C-Eval | 93.0 | Конкурентоспособный |
| Программирование | LiveCodeBench v6 | 83.6 | Gemini / GPT |
| Мультимодальность | MMMU | 85.0 | Конкурентоспособный |
| Мультимодальность | MathVision | 88.6 | Конкурентоспособный |
| Мультимодальность | OCRBench | 93.1 | Конкурентоспособный |
| Мультимодальность | Video-MME | 87.5 | Конкурентоспособный |
Qwen3.5-397B показывает наилучшие результаты в бенчмарках на следование инструкциям и работу с агентами, включая IFBench, MultiChallenge и BrowseComp, где опережает конкурирующие модели. Она также достигает состояния-of-the-art среди открытых моделей на GPQA Diamond, что указывает на сильные способности к научному рассуждению.
На более широких бенчмарках на знания, таких как MMLU-Pro и MMLU-Redux, производительность высокая, но обычно немного уступает ведущим проприетарным моделям. В бенчмарках на программирование результаты конкурентные, но модель не занимает лидирующих позиций.
В целом профиль бенчмарков показывает, что Qwen3.5 оптимизирована для сложных инструкций, использования инструментов и рабочих процессов с агентами, а не для чистого максимизации традиционных академических бенчмарков, таких как программирование или воспроизведение знаний.
Способ 1: Доступ через веб-чат (самый быстрый)
Лучше всего подходит для: быстрого тестирования, экспериментов, демонстраций и непроизводственных сценариев использования, когда вам нужен мгновенный доступ без API-ключей и инфраструктуры.

Время настройки: менее 1 минуты
Официальный чат-интерфейс Qwen обеспечивает мгновенный доступ к Qwen3.5-397B-A17B через ваш браузер:
- Перейдите по ссылке Novita AI
- Выберите Qwen3.5-397B-A17B в выпадающем меню моделей
- Выберите режим «Размышление» для задач, требующих глубокого рассуждения
- Начните общение сразу — не требуется создание аккаунта или API-ключей
Ограничения
- Отсутствует программный доступ — только веб-интерфейс, без интеграции с API
- Применяются лимиты запросов — интерфейс предназначен для интерактивного использования, а не пакетной обработки
- Отсутствует возможность дообучения — вы используете базовую модель в исходном виде
- Ограниченное сохранение контекста — история диалогов управляется интерфейсом
Способ 2: Доступ через API от Novita AI (для production)
Лучше всего подходит для: производственных приложений, кастомных интеграций, программного доступа, масштабируемого вывода и приложений, требующих совместимый с OpenAI формат API.
Время настройки: 5 минут
Novita AI предоставляет управляемый доступ по API к Qwen3.5-397B-A17B с конкурентными тарифами среди крупных провайдеров: $0.60 за 1 млн входных токенов и $3.60 за 1 млн выходных токенов. Сервис предлагает совместимые с OpenAI конечные точки, что делает интеграцию простой для разработчиков, уже знакомых с SDK OpenAI.

Источник: HuggingFace
Пошаговая настройка
Шаг 1: Войдите в аккаунт и откройте библиотеку моделей
Войдите в свой аккаунт и нажмите кнопку «Библиотека моделей».

Шаг 2: Выберите нужную модель
Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Шаг 3: Начните бесплатный пробный период
Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

Шаг 4: Получите ваш API-ключ
Для аутентификации через API мы предоставим вам новый API-ключ. Перейдя на страницу «Настройки», вы можете скопировать API-ключ, как показано на изображении.

Шаг 5: Установите API
Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования. Управлять API-ключами вы можете на странице настроек Novita AI.
После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с LLM от Novita AI. Ниже приведен пример использования API завершения чата для пользователей Python.
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="qwen/qwen3.5-397b-a17b",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=64000,
temperature=0.7
)
print(response.choices[0].message.content)
Возможности API
| Функция | Доступность |
|---|---|
| Совместимость с OpenAI | ✅ Полная поддержка |
| Потоковые ответы | ✅ Поддерживается |
| Вызов функций | ✅ Поддерживается |
| Окно контекста | 262 144 токена |
| Мультимодальные входные данные | ✅ Текст + изображения |
| SLA / время работы | Инфраструктура корпоративного уровня |
Тарифы Novita AI на Qwen3.5-397B-A17B одни из самых конкурентных на рынке. Совместимый с OpenAI API означает, что вы можете интегрировать его в существующие приложения, изменив только базовый URL и API-ключ — без необходимости рефакторинга кода.
Интеграция с инструментами разработки
Бесшовно подключайте Qwen 3 к вашим приложениям, рабочим процессам или чат-ботам с помощью унифицированного REST API от Novita AI — нет необходимости управлять весами модели или инфраструктурой. Novita AI предлагает многоязычные SDK (Python, Node.js, cURL и другие) и расширенные настройки параметров для опытных пользователей.
Интеграция с Claude Code
Claude Code использует переменные окружения для маршрутизации запросов на пользовательские конечные точки моделей. Установите эти четыре переменные перед запуском Claude Code:
Для macOS/Linux:
# Set the Anthropic SDK compatible API endpoint provided by Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Set the model provided by Novita.
export ANTHROPIC_MODEL="qwen/qwen3.5-397b-a17b"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3.5-397b-a17b"
Для Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3.5-397b-a17b"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3.5-397b-a17b"
Интеграция с Trae IDE
- Откройте Trae и включите боковую панель ИИ
- Перейдите в раздел Управление ИИ → Модели
- Нажмите Добавить кастомную модель
- Выберите Novita AI в качестве провайдера
- Введите ваш API-ключ и выберите qwen/qwen3.5-397b-a17b
- Сохраните конфигурацию и начните разработку
Интеграция с OpenCode CLI
# Launch OpenCode
opencode
# Connect to Novita AI
/connect
# Select Novita AI as provider, paste API key
# Choose qwen/qwen3.5-397b-a17b from model list
Способ 3: Локальное развертывание (полный контроль)
Лучше всего подходит для: требований к конфиденциальности данных, офлайн-вывода, кастомных конвейеров вывода, исследовательских сред или сценариев, где вам нужен полный контроль над выполнением модели.
Время настройки: 1–2 часа
Локальное развертывание дает вам полный контроль, но требует значительных аппаратных ресурсов. Полные веса модели занимают примерно 807 ГБ дискового пространства при полной точности.
Требования к оборудованию
| Уровень точности | Требуемый объем VRAM/ОЗУ | Рекомендуемое оборудование |
|---|---|---|
| 8-битное квантование | Около 420 ГБ | 5× H100 80GB или эквивалент |
| 4-битное квантование | Около 200 ГБ | M3 Ultra Mac (256 ГБ объединенной памяти) или 1× GPU 24 ГБ + 256 ГБ системной ОЗУ |
Согласно руководству по развертыванию от Unsloth, 4-битное квантованная версия достигает производительности более 25 токенов в секунду на системе с GPU 24 ГБ и 256 ГБ системной ОЗУ с использованием техник выгрузки MoE. Это делает 4-битное квантование наиболее практичным вариантом для дорогих потребительских решений или развертываний для малого бизнеса.
Аренда облачных GPU для локального развертывания
Если у вас нет необходимого оборудования, но вы все равно хотите самостоятельное развертывание, экземпляры облачных GPU предлагают золотую середину. На основе тарифов Novita AI на экземпляры GPU:
| Конфигурация | Почасовая стоимость (по запросу) | Почасовая стоимость (Spot) | Сценарий использования |
|---|---|---|---|
| 5× H100 80GB | $12.95/час | $6.5/час | 8-битное квантование, производственный уровень |
| 1× RTX 4090 24GB | $0.73/час | $0.37/час | 4-битное квантование, экономически эффективное |
Режим Spot от Novita AI — это оптимизированная по стоимости система аренды GPU, которая использует простаивающие или неиспользуемые мощности GPU платформы. В отличие от экземпляров по запросу, которые резервируют выделенное оборудование для стабильного непрерывного использования, экземпляры Spot являются прерываемыми — ваша задача может быть приостановлена или завершена, если GPU будет возвращен в систему. Поскольку режим Spot перераспределяет в противном случае неиспользуемые ресурсы GPU, он обычно на 40–60% дешевле тарифов по запросу.
Попробуйте экономичные GPU сейчас!
Сравнительная таблица методов
| Метод | Время настройки | Стоимость | Лучше всего подходит для |
|---|---|---|---|
| Веб-чат (площадка Novita AI LLM) | <1 минуты | Бесплатно (с лимитами запросов) | Быстрое тестирование, демонстрации, эксперименты |
| API от Novita AI | 5 минут | $0.60/$3.60 за 1 млн токенов | Производственные приложения, масштабируемый вывод, кастомные интеграции |
| Локальное развертывание (INT4) | 1–2 часа | Стоимость оборудования и система с 256 ГБ ОЗУ | Конфиденциальность данных, офлайн-использование, полный контроль |
| Аренда облачных GPU (INT4) | 30 минут | $0.37/час | Высокообъемный вывод |
Qwen3.5-397B-A17B предлагает гибкие пути доступа для разных сценариев развертывания. Для немедленного тестирования площадка Novita AI LLM не требует никакой настройки и обеспечивает мгновенный доступ к обоим режимам: рассуждению и быстрому. Для производственных приложений, требующих программного доступа, API от Novita AI обеспечивает лучший баланс стоимости и производительности по тарифам $0.60/$3.60 за 1 млн входных/выходных токенов с совместимыми с OpenAI конечными точками, которые бесшовно интегрируются в существующие кодовые базы.
Локальное развертывание остается актуальным для команд с особыми требованиями к конфиденциальности или потребностями в сверхвысокообъемном выводе. Версия с INT4-квантованием может работать на дорогом потребительском оборудовании с 256 ГБ ОЗУ, достигая производительности более 25 токенов в секунду. Однако для большинства разработчиков и малого и среднего бизнеса управляемый доступ по API исключает сложность работы с инфраструктурой, обеспечивая при этом надежность корпоративного уровня.
Часто задаваемые вопросы
Сколько стоит доступ к Qwen3.5-397B-A17B через API?
Novita AI взимает $0.60 за 1 млн входных токенов и $3.60 за 1 млн выходных токенов за доступ к Qwen3.5-397B-A17B — это одни из самых конкурентных тарифов на рынке.
Можно ли запустить Qwen3.5-397B-A17B на потребительском оборудовании?
Да, с INT4-квантованием Qwen3.5-397B-A17B работает на системах с 256 ГБ ОЗУ (например, M3 Ultra Mac) с производительностью более 25 токенов в секунду, требуя около 214 ГБ дискового пространства.
Поддерживает ли Qwen3.5-397B-A17B вызов функций?
Да, Qwen3.5-397B-A17B поддерживает вызов функций при доступе через API-провайдеры, такие как Novita AI, с использованием совместимых с OpenAI конечных точек.
Novita AI — это облачная платформа для ИИ и агентов, которая помогает разработчикам и стартапам создавать, развертывать и масштабировать модели и приложения с агентами с высокой производительностью, надежностью и экономической эффективностью.
Рекомендуемые материалы
