Destaques Principais
A Novita AI lançou o DeepSeek R1 Turbo, oferecendo 3x de throughput e 60% de desconto por tempo limitado. Além disso, esta versão suporta totalmente function calling.
Você pode iniciar um teste gratuito na Novita AI!

Ainda mais empolgante: Novita AI é o 1º lugar para DeepSeek R1 API no OpenRouter

Teste o Demo do DeepSeek R1 Agora!
O que é o DeepSeek R1?
- Data de Lançamento: 21 de janeiro de 2025
- Escala do Modelo:
- Principais Características:
- Tamanho do Modelo: 671B parâmetros (37B ativos/token)
- Tokenizador: Tokenizador aprimorado com tags de auto-reflexão
- Idiomas Suportados: Multilíngue com adaptação cultural
- Multimodal: Apenas texto
- Janela de Contexto: 128K tokens
- Formatos de Armazenamento: Suporte para quantização Q8/Q5
- Arquitetura: Mixture of Experts (MoE) + pipeline de treinamento aprimorado por RL
- Método de Treinamento: Baseado no V3 com pipeline RL (SFT → RL → SFT → RL)
- Dados de Treinamento: Base V3 + dados de otimização RL

Benchmark

O DeepSeek-R1 demonstra melhorias significativas de desempenho na maioria das tarefas, especialmente obtendo aumentos de 9,0% e 5,7% nas tarefas Codeforces e GPQA Diamond, respectivamente, mostrando sua forte capacidade em lidar com tarefas complexas.
Requisitos de Hardware do DeepSeek R1
| Modelo | precisão | GPU | Quantidade |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
| DeepSeek-R1 (671B) | BF16 | H100 | 8 |
Os requisitos de hardware do DeepSeek-R1 são claramente estratificados:
- Modelos destilados têm requisitos de hardware relativamente baixos, especialmente para escalas pequenas e médias, sendo adequados para hardware de consumo de alto nível (ex.: RTX 4090).
- Modelos completos têm requisitos de hardware extremamente altos, especialmente modelos ultra-grandes, que dependem de hardware profissional (ex.: GPUs H100).
- No geral, a tecnologia de destilação reduz significativamente os requisitos de hardware e aumenta a flexibilidade da implantação do modelo, mas os modelos completos ainda exigem hardware de alto desempenho para atingir o pico de performance.
Se achar muito complicado comprar GPUs ou fazer a implantação por conta própria, você pode usar os serviços de GPU e API da Novita AI, que oferecem uma versão totalmente otimizada do DeepSeek-R1. É extremamente conveniente e cobra com base no número de tokens.
Escolhendo a Novita AI para Serviços de GPU em Nuvem
Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer a nuvem de GPU acessível e confiável para construir e escalar.
Passo 1: Registre uma conta
Se você é novo na Novita AI, comece criando uma conta em nosso site. Depois de registrado, vá para a aba “GPUs” para explorar os recursos disponíveis e iniciar sua jornada.

Passo 2: Explorando Modelos e Servidores de GPU
Comece selecionando um modelo que corresponda às necessidades do seu projeto, como PyTorch, TensorFlow ou CUDA. Escolha a versão que atenda aos seus requisitos, por exemplo, PyTorch 2.2.1 ou CUDA 11.8.0. Em seguida, selecione a configuração do servidor de GPU A100, que oferece desempenho poderoso para lidar com cargas de trabalho exigentes, com ampla VRAM, RAM e capacidade de disco.

Experimente as GPUs de Alto Desempenho da Novita AI
Passo 3: Personalize Sua Implantação
Após selecionar um modelo e GPU, personalize as configurações de implantação ajustando parâmetros como a versão do sistema operacional (ex.: CUDA 11.8). Você também pode ajustar outras configurações para adequar o ambiente aos requisitos específicos do seu projeto.

Passo 4: Inicie uma instância
Depois de finalizar o modelo e as configurações de implantação, clique em “Launch Instance” para configurar sua instância de GPU. Isso iniciará a configuração do ambiente, permitindo que você comece a usar os recursos de GPU para suas tarefas de IA.

Escolhendo a Novita AI para Serviços de API
Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer a nuvem de GPU acessível e confiável para construir e escalar.
Passo 1: Faça login e acesse a Biblioteca de Modelos
Faça login na sua conta e clique no botão Model Library.

Teste o Demo do DeepSeek R1 Agora!
Passo 2: Escolha Seu Modelo
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito
Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API
Para autenticar com a API, forneceremos uma nova chave de API. Entre na página “Settings” e copie a chave de API conforme indicado na imagem.

Passo 5: Instale a API
Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de chat completions para usuários Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
A Novita AI revoluciona a implantação de IA com o DeepSeek R1 Turbo, oferecendo 3x de throughput e suporte para recursos avançados como function calling, agora disponível com 20% de desconto por tempo limitado. Seja executando modelos destilados em GPUs de consumo como RTX 4090 ou implantando modelos completos com GPUs H100 de nível empresarial, a Novita AI oferece flexibilidade incomparável. Para quem busca uma solução sem complicações, os serviços de GPU e API da Novita AI oferecem uma versão totalmente otimizada do DeepSeek R1 Turbo, combinada com preços baseados em tokens e um teste gratuito. Experimente o desempenho de IA de próxima geração com o DeepSeek R1 Turbo — comece com a Novita AI hoje mesmo!
Perguntas Frequentes
O que é o DeepSeek R1 Turbo?
O DeepSeek R1 Turbo é uma versão otimizada do DeepSeek R1, oferecendo 3x de throughput, suporte total para function calling e 20% de desconto por tempo limitado na Novita AI!
Qual hardware é necessário para executar o DeepSeek R1?
Modelos completos: Requerem GPUs de nível empresarial como H100 para desempenho ideal.
Posso experimentar o DeepSeek R1 gratuitamente?
Sim, a Novita AI oferece um teste gratuito do DeepSeek R1 através de sua plataforma de API.
Novita AI é a plataforma de nuvem All-in-one que potencializa suas ambições de IA. APIs integradas, serverless, instância de GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA realidade.
