Как получить доступ к MiniMax M1

Как получить доступ к MiniMax M1

MiniMax M1 представляет собой значительный скачок в технологии языковых моделей ИИ, предлагая мощные возможности длинного контекста и гибкие варианты развертывания. Это подробное руководство проведет вас через процесс получения доступа и реализации MiniMax M1, предоставляя инструменты, необходимые для улучшения проектов на основе ИИ.

Ключевые моменты

MiniMax M1: модель MoE с 456B параметров и контекстом 1M.

Использование MiniMax M1 через API
Простой, совместимый с OpenAI API.
Настраиваемые параметры, доступен бесплатный пробный период.

Локальное использование MiniMax M1
Пошаговое руководство по установке.

Подключение MiniMax M1 на сторонних платформах
Бесшовная интеграция MiniMax M1 через Hugging Face Spaces, фреймворки агентов и API, совместимые с OpenAI, для оптимизации рабочих процессов разработки.

На ограниченное время новые пользователи могут получить $10 бесплатных кредитов, чтобы исследовать и создавать с помощью LLM API на Novita AI.

Что такое MiniMax M1?

MiniMax M1 — это первая в мире открытая крупномасштабная гибридно-экспертная модель рассуждения. Она объединяет архитектуру смеси экспертов (MoE) с инновационным механизмом Lightning Attention, разработанным специально для сверхдлинных контекстов и сложных задач. MiniMax поддерживает вызов функций, а возможность обработки до 1 миллиона токенов контекста делает её идеальной для исследований, разработки программного обеспечения, математических рассуждений и других требовательных приложений.

Основная информация Детали
Дата выпуска Июнь 2025
Размер модели 456B параметров (45.9B активных)
Архитектура Гибридная смесь экспертов (MoE) с Lightning Attention
Длина контекста 1M токенов
Обучение Крупномасштабное обучение с подкреплением на разнообразных наборах задач
Особенности Эффективное масштабирование вычислительных ресурсов во время тестирования, гибридное внимание для RL

benchmark of MiniMax M1

Minimax M1 benchmarks

Minimax M1

Эффективная обработка длинного контекста:

  • Поддерживает длинное окно контекста, позволяя обрабатывать очень длинные документы, технические кодовые базы и многоходовые диалоги за один проход.
  • Использует гибридную архитектуру смеси экспертов (MoE) с lightning attention для эффективного вывода, снижая вычислительные затраты примерно до 25% от сопоставимых плотных моделей.
  • Идеально подходит для предприятий, работающих с крупномасштабными базами знаний, исследовательскими работами и агентными рабочими процессами, требующими глубокого понимания контекста.

Экономически эффективное развертывание:

  • Предлагает конкурентоспособные цены API: $0,55 за миллион входных токенов и $2,2 за миллион выходных токенов.

Открытый исходный код и удобство для исследований:

  • Полностью открытая модель с открытыми весами, поощряющая тонкую настройку и интеграцию сообществом, поддерживающая специализированную настройку в таких областях, как право, медицина и научные исследования.
  • Поддерживает вызов функций и использование инструментов агентного ИИ, обеспечивая сложные рабочие процессы и многошаговые рассуждения.

Использование MiniMax M1 через API

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надежное облако GPU для создания и масштабирования.

Шаг 1: Войдите в систему и откройте библиотеку моделей

Войдите в свою учетную запись и нажмите кнопку Model Library (Библиотека моделей).

Log In and Access the Model Library

Попробуйте демо MiniMax M1 сейчас!

Шаг 2: Выберите свою модель

Просмотрите доступные варианты и выберите модель, которая подходит для ваших задач.

Choose Your Model

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

MiniMax M1 playground

Шаг 4: Получите свой API-ключ

Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу “Settings” (Настройки), вы можете скопировать API-ключ, как показано на изображении.

get api key

Шаг 5: Установите API

Установите API с помощью пакетного менеджера, соответствующего вашему языку программирования.

install api

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Вот пример использования API чат-завершений для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Запуск MiniMax M1 локально

Пошаговое руководство по установке

# Шаг 1: Установите Python и создайте виртуальное окружение
# Убедитесь, что установлен Python 3.8+, затем создайте и активируйте виртуальное окружение.
python3 -m venv minimax_env
source minimax_env/bin/activate  # В Windows используйте `minimax_env\Scripts\activate`

# Шаг 2: Установите необходимые библиотеки
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118  # GPU-оптимизированный PyTorch
pip install vllm huggingface-hub  # vLLM для обслуживания MiniMax M1 и утилиты Hugging Face

# Шаг 3: (Опционально) Войдите в Hugging Face, если хотите загрузить модели позже
pip install huggingface-cli
huggingface-cli login  # Следуйте инструкциям для аутентификации

# Шаг 4: Загрузите модель MiniMax M1 (если еще не скачана)
# Замените <model-name> на актуальное имя репозитория MiniMax M1 на Hugging Face
huggingface-cli download MiniMaxAI/MiniMax-M1-80k --local-dir ./minimax-m1

# Шаг 5: Установите переменную окружения для быстрой загрузки (Linux/macOS)
export SAFETENSORS_FAST_GPU=1

# Шаг 6: Запустите сервер API MiniMax M1 с vLLM
# Настройте --tensor-parallel-size в соответствии с количеством ваших GPU
python3 -m vllm.entrypoints.api_server \
  --model ./minimax-m1 \
  --tensor-parallel-size 8 \
  --trust-remote-code \
  --max_model_len 8192 \
  --dtype bfloat16

# Шаг 7: Проверьте вывод с помощью curl (в новом терминале)
curl -X POST http://localhost:8000/generate \
  -H "Content-Type: application/json" \
  -d '{"prompt": "Объясните квантовые вычисления простыми словами.", "max_tokens": 100}'

# Шаг 8: (Опционально) Пример вывода на Python
python3 -c "
import requests
response = requests.post('http://localhost:8000/generate', json={
    'prompt': 'Объясните квантовые вычисления простыми словами.',
    'max_tokens': 100
})
print(response.json())
"

Требования к памяти GPU:

  • Минимум: 640 ГБ VRAM
  • Рекомендуется: 1,128 ГБ VRAM (конфигурация 8 x H200 SXM 141 ГБ) для оптимальной производительности

Подключение MiniMax M1 на сторонних платформах

  • Hugging Face: Используйте MiniMax M1 в Spaces, пайплайнах или с библиотекой Transformers через конечные точки Novita AI.

MiniMax M1 на Huggingface

  • Фреймворки агентов и оркестрации: Легко подключайте Novita AI к платформам-партнерам, таким как Continue, AnythingLLM,LangChain, Dify и Langflow, с помощью официальных коннекторов и пошаговых руководств по интеграции.
  • API, совместимый с OpenAI: Наслаждайтесь безпроблемной миграцией и интеграцией с такими инструментами, как Cline и Cursor, разработанными для стандарта OpenAI API.

Novita AI интегрирована с более чем 20 платформами, подробные руководства можно найти в документации.

Novita AI интегрирована с более чем 20 платформами

MiniMax M1 — это революционная крупномасштабная модель рассуждения с гибридным вниманием, которая превосходно справляется со сверхдлинными контекстами и сложными задачами рассуждения. Она объединяет гибридную архитектуру смеси экспертов (MoE) с механизмом lightning attention, обеспечивая эффективный и масштабируемый вывод. Вы можете использовать MiniMax M1 через API или подключить его на сторонних платформах.

На ограниченное время новые пользователи могут получить $10 бесплатных кредитов, чтобы исследовать и создавать с помощью LLM API на Novita AI.

Часто задаваемые вопросы

Как использовать MiniMax AI бесплатно?

Вы можете попробовать демо MiniMax AI бесплатно на Novita AI. Новые пользователи могут получить $10 бесплатных кредитов, чтобы исследовать и создавать с помощью LLM API на Novita AI.

Какое оборудование необходимо для локального запуска MiniMax M1?

Минимум: 640 ГБ VRAM
Рекомендуется: 1,128 ГБ VRAM (конфигурация 8 x H200 SXM 141 ГБ) для оптимальной производительности

Является ли MiniMax M1 открытым исходным кодом?

Да, MiniMax M1 полностью открыт и доступен на таких платформах, как Hugging Face.

О компании Novita AI

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надежное облако GPU для создания и масштабирования.