Destaques principais
Desempenho Avançado: Excelente em benchmarks de matemática e codificação.
Código Aberto: Acessível para pesquisa, modificação e implantação.
Eficiência de Custo: Oferece desempenho comparável ao o1 da OpenAI a uma fração do custo.
4 Formas Gratuitas: Plataformas Online, Localmente, API, AI Playgrounds
DeepSeek R1 é um modelo de raciocínio de ponta projetado para rivalizar com o o1 da OpenAI, destacando-se em tarefas complexas como inferência lógica, matemática e programação. Sua natureza open-source e foco em capacidades avançadas de raciocínio o tornam uma ferramenta extremamente valiosa para desenvolvedores e empresas. No entanto, o R1 tem um preço mais alto em comparação ao DeepSeek V3. Para ajudar você a começar, aqui estão quatro maneiras gratuitas de explorar e utilizar o DeepSeek R1.
Visão Geral do Deepseek R1
O DeepSeek-R1 foi projetado para lidar com tarefas que exigem raciocínio lógico, matemática avançada e programação. Ele se baseia no DeepSeek-R1-Zero combinando aprendizado por reforço com ajuste fino supervisionado para melhorar a clareza e a coerência da saída. O DeepSeek-R1 alcança desempenho comparável ao OpenAI-o1 em tarefas de matemática, código e raciocínio.

Obtenha $20 em créditos e inicie um teste gratuito no Deepseek R1 agora!
Principais Características
- Tamanho do Modelo: 671B parâmetros (37B ativos/token)
- Tokenizador: Tokenizador aprimorado com tags de autorreflexão
- Idiomas Suportados: Multilíngue com adaptação cultural
- Multimodal: Apenas texto
- Janela de Contexto: 128K tokens
- Formatos de Armazenamento: Suporte a quantização Q8/Q5
- Arquitetura: Mistura de Especialistas (MoE) + pipeline de treinamento aprimorado com RL
- Método de Treinamento: Construído sobre a base V3 com pipeline RL (SFT → RL → SFT → RL)
- Dados de Treinamento: Base V3 + dados de otimização RL
Benchmarks de Desempenho
O DeepSeek-R1 se destaca em matemática, alcançando pontuações máximas de 97,3% no MATH-500 e 79,8% no AIME 2024, superando concorrentes. Em codificação, ele se destaca com 49,2% no SWE-bench Verified e 65,9% no Live Code Bench, mostrando sua expertise versátil em ambos os domínios.

Todos os modelos são avaliados com um comprimento máximo de geração de 32.768 tokens, usando parâmetros de amostragem específicos (temperatura 0,6, top-p 0,95 e 64 respostas por consulta) para calcular pass@1 para benchmarks.
Modelos DeepSeek-R1-Distill
Destilação, ou destilação de conhecimento, é um método de aprendizado de máquina que transfere conhecimento de um modelo maior para um menor. O objetivo é desenvolver um modelo mais eficiente que possa alcançar desempenho semelhante ao modelo maior.
DeepSeek também lançou versões destiladas do R1, oferecendo modelos menores que retêm grande parte das capacidades do modelo original, sendo mais eficientes computacionalmente. Esses modelos são ajustados usando dados gerados pelo DeepSeek-R1 e estão disponíveis em tamanhos de 1,5 bilhão a 70 bilhões de parâmetros.
- deepseek/deepseek-r1-distill-qwen-14b
- deepseek/deepseek-r1-distill-qwen-32b
- deepseek/deepseek-r1-distill-llama-70b
- deepseek/deepseek-r1-distill-llama-8b

Fonte: Paper de lançamento do DeepSeek
1.Use Plataformas Online para Acessar o Deepseek R1 (ex.: Novita AI)
Você pode acessar o DeepSeek-R1 através da plataforma Novita AI, que oferece uma maneira simples de interagir com o modelo. Para começar, basta ir para a página de chat e se registrar. No entanto, note que a plataforma online não suporta salvar o histórico de chat de sessões anteriores.
Além disso, a Novita AI oferece um painel de ajuste de parâmetros, permitindo personalizar configurações como max tokens, temperature e outras para atender ao seu caso de uso específico.

Obtenha $20 em créditos na Novita AI agora!
2.Execute o Deepseek R1 Localmente
1. Instale o Ollama
- Acesse o site do Ollama, baixe e instale a versão para seu sistema operacional.
2. Baixe o Modelo DeepSeek-R1
- Abra seu terminal e execute (usando a versão de 7B parâmetros como exemplo): bashCopy
ollama run deepseek-r1:7b(Aguarde o download; o tempo depende da velocidade da rede.)
ollama run deepseek-r1:7b
3. Verifique e Execute
- Verificar Instalação:
ollama list # Verifique se "deepseek-r1" aparece na lista
- Iniciar o Modelo:
ollama run deepseek-r1:7b
4. Exemplos de Uso
- Faça uma Pergunta: bashCopy
>>> "Explique computação quântica em termos simples." - Gere Código: bashCopy
>>> "Escreva uma função Python para calcular a sequência de Fibonacci."
3.Acesse APIs Gratuitas do Deepseek R1 (ex.: Novita AI)
Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer a GPU em nuvem acessível e confiável para construir e escalar.
Passo 1: Faça Login e Acesse a Biblioteca de Modelos
Faça login na sua conta e clique no botão Model Library.

Passo 2: Escolha Seu Modelo
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito
Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API
Para autenticar com a API, forneceremos uma nova chave de API. Acesse a página “Settings” e copie a chave de API conforme indicado na imagem.

Passo 5: Instale a API
Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o Novita AI LLM. Este é um exemplo de uso da API de chat completions para usuários Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
4.Experimente o Deepseek R1 no Hugging Face
Passo 1: Configure as Chaves de API
- Navegue até as configurações da sua conta de usuário para gerenciar suas chaves de API.
- Adicione suas chaves de API personalizadas da Novita AI ao Hugging Face.

Passo 2: Escolha os Modos de API de Inferência
- Modo de Chave Personalizada: As chamadas são enviadas diretamente ao provedor de inferência, utilizando sua própria chave de API.
- Modo HF-Routed: Neste modo, nenhum token de provedor é necessário. As cobranças são aplicadas à sua conta do Hugging Face em vez da conta do provedor.

Passo 3: Explore Provedores Compatíveis nas Páginas dos Modelos
- As páginas dos modelos exibem provedores de inferência de terceiros compatíveis com o modelo selecionado (aqueles que são compatíveis com o modelo atual, ordenados por preferência do usuário).

Experimentar nos AI Playgrounds é uma excelente maneira de explorar as capacidades dos modelos Llama 3 sem a necessidade de habilidades técnicas avançadas ou configuração. Seja usando HuggingChat para projetos criativos, Meta AI Web para integração perfeita em aplicativos diários, ou Perplexity Labs para experimentos prolongados, essas plataformas tornam a IA de ponta acessível e prática para usuários de todos os níveis.
Perguntas Frequentes
O DeepSeek R1 é melhor que o o1 da OpenAI?
O DeepSeek R1 oferece desempenho comparável, especialmente em tarefas de raciocínio, e é open source e mais econômico.
Quais tarefas são mais adequadas para o DeepSeek R1?
Tarefas intensivas em raciocínio, como resolução de problemas matemáticos, codificação e aplicações específicas do setor.
O DeepSeek-R1 pode ser ajustado para tarefas ou setores específicos?
Sim, o DeepSeek-R1 pode ser ajustado para tarefas específicas, desde que você tenha os recursos computacionais e dados necessários.
Novita AI é a plataforma de nuvem completa que impulsiona suas ambições de IA. APIs integradas, Serverless, GPU Instance — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA realidade.
