Novita AI é o 1º lugar para DeepSeek R1 API no OpenRouter

Índice

O que é o DeepSeek R1?
Requisitos de Hardware do DeepSeek R1
Escolhendo a Novita AI para Serviços de GPU em Nuvem
Escolhendo a Novita AI para Serviços de API
Perguntas Frequentes

Destaques Principais

A Novita AI lançou o DeepSeek R1 Turbo, oferecendo 3x de throughput e 60% de desconto por tempo limitado. Além disso, esta versão suporta totalmente function calling.

Você pode iniciar um teste gratuito na Novita AI!

Ainda mais empolgante: Novita AI é o 1º lugar para DeepSeek R1 API no OpenRouter

Teste o Demo do DeepSeek R1 Agora!

O que é o DeepSeek R1?

Data de Lançamento: 21 de janeiro de 2025
Escala do Modelo:
Principais Características:
- Tamanho do Modelo: 671B parâmetros (37B ativos/token)
- Tokenizador: Tokenizador aprimorado com tags de auto-reflexão
- Idiomas Suportados: Multilíngue com adaptação cultural
- Multimodal: Apenas texto
- Janela de Contexto: 128K tokens
- Formatos de Armazenamento: Suporte para quantização Q8/Q5
- Arquitetura: Mixture of Experts (MoE) + pipeline de treinamento aprimorado por RL
- Método de Treinamento: Baseado no V3 com pipeline RL (SFT → RL → SFT → RL)
- Dados de Treinamento: Base V3 + dados de otimização RL

fonte

Benchmark

O DeepSeek-R1 demonstra melhorias significativas de desempenho na maioria das tarefas, especialmente obtendo aumentos de 9,0% e 5,7% nas tarefas Codeforces e GPQA Diamond, respectivamente, mostrando sua forte capacidade em lidar com tarefas complexas.

Requisitos de Hardware do DeepSeek R1

Modelo	precisão	GPU	Quantidade
DeepSeek-R1-Distill-Qwen-1.5B	BF16	RTX 4090	1
DeepSeek-R1-Distill-Qwen-7B	BF16	RTX 4090	1
DeepSeek-R1-Distill-Llama-8B	BF16	RTX 4090	1
DeepSeek-R1-Distill-Qwen-14B	BF16	RTX 4090	2
DeepSeek-R1-Distill-Qwen-32B	BF16	RTX 4090	4
DeepSeek-R1-Distill-Llama-70B	BF16	RTX 4090	8
DeepSeek-R1 (671B)	BF16	H100	8

Os requisitos de hardware do DeepSeek-R1 são claramente estratificados:

Modelos destilados têm requisitos de hardware relativamente baixos, especialmente para escalas pequenas e médias, sendo adequados para hardware de consumo de alto nível (ex.: RTX 4090).
Modelos completos têm requisitos de hardware extremamente altos, especialmente modelos ultra-grandes, que dependem de hardware profissional (ex.: GPUs H100).
No geral, a tecnologia de destilação reduz significativamente os requisitos de hardware e aumenta a flexibilidade da implantação do modelo, mas os modelos completos ainda exigem hardware de alto desempenho para atingir o pico de performance.

Se achar muito complicado comprar GPUs ou fazer a implantação por conta própria, você pode usar os serviços de GPU e API da Novita AI, que oferecem uma versão totalmente otimizada do DeepSeek-R1. É extremamente conveniente e cobra com base no número de tokens.

Escolhendo a Novita AI para Serviços de GPU em Nuvem

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer a nuvem de GPU acessível e confiável para construir e escalar.

Passo 1: Registre uma conta

Se você é novo na Novita AI, comece criando uma conta em nosso site. Depois de registrado, vá para a aba “GPUs” para explorar os recursos disponíveis e iniciar sua jornada.

Passo 2: Explorando Modelos e Servidores de GPU

Comece selecionando um modelo que corresponda às necessidades do seu projeto, como PyTorch, TensorFlow ou CUDA. Escolha a versão que atenda aos seus requisitos, por exemplo, PyTorch 2.2.1 ou CUDA 11.8.0. Em seguida, selecione a configuração do servidor de GPU A100, que oferece desempenho poderoso para lidar com cargas de trabalho exigentes, com ampla VRAM, RAM e capacidade de disco.

Experimente as GPUs de Alto Desempenho da Novita AI

Passo 3: Personalize Sua Implantação

Após selecionar um modelo e GPU, personalize as configurações de implantação ajustando parâmetros como a versão do sistema operacional (ex.: CUDA 11.8). Você também pode ajustar outras configurações para adequar o ambiente aos requisitos específicos do seu projeto.

Passo 4: Inicie uma instância

Depois de finalizar o modelo e as configurações de implantação, clique em “Launch Instance” para configurar sua instância de GPU. Isso iniciará a configuração do ambiente, permitindo que você comece a usar os recursos de GPU para suas tarefas de IA.

Escolhendo a Novita AI para Serviços de API

Faça login na sua conta e clique no botão Model Library.

Teste o Demo do DeepSeek R1 Agora!

Passo 2: Escolha Seu Modelo

Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito

Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API. Entre na página “Settings” e copie a chave de API conforme indicado na imagem.

Passo 5: Instale a API

Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de chat completions para usuários Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

A Novita AI revoluciona a implantação de IA com o DeepSeek R1 Turbo, oferecendo 3x de throughput e suporte para recursos avançados como function calling, agora disponível com 20% de desconto por tempo limitado. Seja executando modelos destilados em GPUs de consumo como RTX 4090 ou implantando modelos completos com GPUs H100 de nível empresarial, a Novita AI oferece flexibilidade incomparável. Para quem busca uma solução sem complicações, os serviços de GPU e API da Novita AI oferecem uma versão totalmente otimizada do DeepSeek R1 Turbo, combinada com preços baseados em tokens e um teste gratuito. Experimente o desempenho de IA de próxima geração com o DeepSeek R1 Turbo — comece com a Novita AI hoje mesmo!

Perguntas Frequentes

O que é o DeepSeek R1 Turbo?

O DeepSeek R1 Turbo é uma versão otimizada do DeepSeek R1, oferecendo 3x de throughput, suporte total para function calling e 20% de desconto por tempo limitado na Novita AI!

Qual hardware é necessário para executar o DeepSeek R1?

Modelos completos: Requerem GPUs de nível empresarial como H100 para desempenho ideal.

Posso experimentar o DeepSeek R1 gratuitamente?

Sim, a Novita AI oferece um teste gratuito do DeepSeek R1 através de sua plataforma de API.

Novita AI é a plataforma de nuvem All-in-one que potencializa suas ambições de IA. APIs integradas, serverless, instância de GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA realidade.

Novita AI é o 1º lugar para DeepSeek R1 API no OpenRouter

Destaques Principais

O que é o DeepSeek R1?

Benchmark

Requisitos de Hardware do DeepSeek R1

Escolhendo a Novita AI para Serviços de GPU em Nuvem

Passo 1: Registre uma conta

Passo 2: Explorando Modelos e Servidores de GPU

Passo 3: Personalize Sua Implantação

Passo 4: Inicie uma instância

Escolhendo a Novita AI para Serviços de API

Passo 2: Escolha Seu Modelo

Passo 3: Inicie Seu Teste Gratuito

Passo 4: Obtenha Sua Chave de API

Passo 5: Instale a API

Perguntas Frequentes

Leitura Recomendada

Product

RESOURCES

Partners

Company

Destaques Principais

O que é o DeepSeek R1?

Benchmark

Requisitos de Hardware do DeepSeek R1

Escolhendo a Novita AI para Serviços de GPU em Nuvem

Passo 1: Registre uma conta

Passo 2: Explorando Modelos e Servidores de GPU

Passo 3: Personalize Sua Implantação

Passo 4: Inicie uma instância

Escolhendo a Novita AI para Serviços de API

Passo 1: Faça login e acesse a Biblioteca de Modelos

Passo 2: Escolha Seu Modelo

Passo 3: Inicie Seu Teste Gratuito

Passo 4: Obtenha Sua Chave de API

Passo 5: Instale a API

Perguntas Frequentes

Leitura Recomendada

Posts relacionados

Product

RESOURCES

Partners

Company