Como acessar o MiniMax M1

Como acessar o MiniMax M1

O MiniMax M1 representa um salto significativo na tecnologia de modelos de linguagem de IA, introduzindo poderosas capacidades de raciocínio de contexto longo e opções de implantação flexíveis. Este guia completo mostra como acessar e implementar o MiniMax M1, oferecendo as ferramentas necessárias para potencializar projetos baseados em IA.

Destaques Principais

MiniMax M1: Modelo MoE de 456B parâmetros, contexto de 1M.

Usando o MiniMax M1 via API
Fácil, API compatível com OpenAI.
Parâmetros personalizáveis, teste gratuito disponível.

Usando o MiniMax M1 Localmente
Guia de Instalação Passo a Passo.

Conecte o MiniMax M1 em Plataformas de Terceiros
Integre perfeitamente o MiniMax M1 através do Hugging Face Spaces, frameworks de agentes e APIs compatíveis com OpenAI para fluxos de trabalho de desenvolvimento simplificados.

Por tempo limitado, novos usuários podem receber $10 em créditos gratuitos para explorar e construir com a API LLM na Novita AI.

O que é o MiniMax M1?

O MiniMax M1 é o primeiro modelo de raciocínio de especialista híbrido de código aberto em grande escala do mundo. Ele combina uma arquitetura Mixture-of-Experts (MoE) com o inovador mecanismo Lightning Attention, projetado especificamente para raciocínio de contexto ultra longo e tarefas complexas. O MiniMax suporta chamada de função e sua capacidade de processar até 1 milhão de tokens de contexto o torna ideal para pesquisa, desenvolvimento de software, raciocínio matemático e outras aplicações exigentes.

Informações Básicas Detalhes
Data de Lançamento Junho de 2025
Tamanho do Modelo 456B parâmetros (45.9B ativos)
Arquitetura Hybrid Mixture-of-Experts (MoE) com Lightning Attention
Comprimento do Contexto 1M tokens
Treinamento Aprendizagem por Reforço em larga escala em diversos conjuntos de problemas
Características Especiais Escalonamento eficiente de computação em tempo de teste, atenção híbrida para RL

benchmark do MiniMax M1

Benchmarks do MiniMax M1

MiniMax M1

Processamento Eficiente de Contexto Longo:

  • Suporta janela de contexto longo, permitindo o processamento de documentos extremamente longos, bases de código técnicas e conversas de múltiplas etapas em uma única passagem.
  • Usa uma arquitetura híbrida Mixture-of-Experts (MoE) com atenção relâmpago para inferência eficiente, reduzindo o custo computacional para cerca de 25% de modelos densos comparáveis.
  • Ideal para empresas que lidam com bases de conhecimento em grande escala, artigos de pesquisa e fluxos de trabalho de agentes que exigem compreensão contextual profunda.

Implantação Econômica:

  • Oferece preços de API competitivos a $0,55 por milhão de tokens de entrada e $2,2 por milhão de tokens de saída.

Código Aberto e Amigável à Pesquisa:

  • Modelo totalmente de pesos abertos, incentivando o ajuste fino e a integração pela comunidade, suportando personalização de domínio específico em áreas como pesquisa jurídica, médica e científica.
  • Suporta chamada de função e uso de ferramentas de IA de agente, permitindo fluxos de trabalho complexos e raciocínio de múltiplas etapas.

Usando o MiniMax M1 via API

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, ao mesmo tempo em que fornece nuvem GPU acessível e confiável para construção e escalabilidade.

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Model Library.

Faça Login e Acesse a Biblioteca de Modelos

Experimente o MiniMax M1 Demo Agora!

Passo 2: Escolha Seu Modelo

Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Escolha Seu Modelo

Passo 3: Inicie Seu Teste Gratuito

Inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

Playground do MiniMax M1

Passo 4: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API. Acesse a página “Settings” e copie a chave de API conforme indicado na imagem.

obter chave de api

Passo 5: Instale a API

Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

instalar api

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Execute o MiniMax M1 Localmente

Guia de Instalação Passo a Passo

# Step 1: Install Python and Create a Virtual Environment
# Make sure Python 3.8+ is installed, then create and activate a virtual environment.
python3 -m venv minimax_env
source minimax_env/bin/activate  # On Windows, use `minimax_env\Scripts\activate`

# Step 2: Install Required Libraries
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118  # GPU optimized PyTorch
pip install vllm huggingface-hub  # vLLM for serving MiniMax M1, and Hugging Face utilities

# Step 3: (Optional) Login to Hugging Face if you want to pull models later
pip install huggingface-cli
huggingface-cli login  # Follow prompts to authenticate

# Step 4: Download MiniMax M1 Model (if not already done)
# Replace <model-name> with actual MiniMax M1 repo name on Hugging Face
huggingface-cli download MiniMaxAI/MiniMax-M1-80k --local-dir ./minimax-m1

# Step 5: Set Environment Variable for Fast Loading (Linux/macOS)
export SAFETENSORS_FAST_GPU=1

# Step 6: Launch MiniMax M1 API Server with vLLM
# Adjust --tensor-parallel-size according to your GPU count
python3 -m vllm.entrypoints.api_server \
  --model ./minimax-m1 \
  --tensor-parallel-size 8 \
  --trust-remote-code \
  --max_model_len 8192 \
  --dtype bfloat16

# Step 7: Test Inference with curl (in a new terminal)
curl -X POST http://localhost:8000/generate \
  -H "Content-Type: application/json" \
  -d '{"prompt": "Explain quantum computing in simple terms.", "max_tokens": 100}'

# Step 8: (Optional) Python inference example
python3 -c "
import requests
response = requests.post('http://localhost:8000/generate', json={
    'prompt': 'Explain quantum computing in simple terms.',
    'max_tokens': 100
})
print(response.json())
"

Requisitos de Memória GPU:

  • Mínimo: 640GB VRAM
  • Recomendado: 1.128GB VRAM (configuração 8 x H200 SXM 141GB) para desempenho ideal

Conecte o MiniMax M1 em Plataformas de Terceiros

  • Hugging Face: Use o MiniMax M1 em Spaces, pipelines ou com a biblioteca Transformers através dos endpoints da Novita AI.

MiniMax M1 no Hugging Face

  • Frameworks de Agentes e Orquestração: Conecte facilmente a Novita AI com plataformas parceiras como Continue, AnythingLLM,LangChain, Dify e Langflow através de conectores oficiais e guias de integração passo a passo.
  • API Compatível com OpenAI: Desfrute de migração e integração sem complicações com ferramentas como Cline e Cursor, projetadas para o padrão da API OpenAI.

A Novita AI integrou-se a mais de 20 plataformas, e tutoriais detalhados podem ser encontrados na documentação.

Novita AI Integra-se a mais de 20 Plataformas

O MiniMax M1 é um modelo de raciocínio de atenção híbrida inovador em grande escala que se destaca no manuseio de comprimentos de contexto ultra longos e tarefas de raciocínio complexas. Ele apresenta uma arquitetura híbrida Mixture-of-Experts (MoE) combinada com um mecanismo de atenção relâmpago, permitindo inferência eficiente e escalável. Você pode usar o MiniMax M1 via API ou conectá-lo em plataformas de terceiros.

Por tempo limitado, novos usuários podem receber $10 em créditos gratuitos para explorar e construir com a API LLM na Novita AI.

Perguntas Frequentes

Como usar o MiniMax AI gratuitamente?

Você pode testar a demonstração do MiniMax AI gratuitamente na Novita AI. Novos usuários podem receber $10 em créditos gratuitos para explorar e construir com a API LLM na Novita AI.

Qual hardware é necessário para executar o MiniMax M1 localmente?

Mínimo: 640GB VRAM
Recomendado: 1.128GB VRAM (configuração 8 x H200 SXM 141GB) para desempenho ideal

O MiniMax M1 é código aberto?

Sim, o MiniMax M1 é totalmente código aberto e está disponível em plataformas como Hugging Face.

Sobre a Novita AI

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, ao mesmo tempo que fornece nuvem GPU acessível e confiável para construção e escalabilidade.