Novita AI занимает 1-е место по DeepSeek R1 API на OpenRouter

Novita AI занимает 1-е место по DeepSeek R1 API на OpenRouter

Ключевые моменты

Компания Novita AI представила DeepSeek R1 Turbo, обеспечивающий 3-кратную пропускную способность и ограниченную по времени скидку 60%. Кроме того, эта версия полностью поддерживает вызов функций (function calling).

Вы можете начать бесплатную пробную версию на Novita AI!

deepseek r1 turbo price

Что ещё интереснее: Novita AI занимает 1-е место по DeepSeek R1 API на OpenRouter

Попробуйте DeepSeek R1 Demo сейчас!

Что такое DeepSeek R1?

r1 creation

source

Бенчмарк

benchmark of deepseek r1

DeepSeek-R1 демонстрирует значительное улучшение производительности в большинстве задач, особенно достигая прироста на 9,0% и 5,7% в задачах Codeforces и GPQA Diamond соответственно, что показывает его высокие способности в обработке сложных задач.

Требования к оборудованию для DeepSeek R1

Модель Точность GPU Количество
DeepSeek-R1-Distill-Qwen-1.5B BF16 RTX 4090 1
DeepSeek-R1-Distill-Qwen-7B BF16 RTX 4090 1
DeepSeek-R1-Distill-Llama-8B BF16 RTX 4090 1
DeepSeek-R1-Distill-Qwen-14B BF16 RTX 4090 2
DeepSeek-R1-Distill-Qwen-32B BF16 RTX 4090 4
DeepSeek-R1-Distill-Llama-70B BF16 RTX 4090 8
DeepSeek-R1 (671B) BF16 H100 8

Требования к оборудованию для DeepSeek-R1 чётко стратифицированы:

  • Дистиллированные модели имеют относительно низкие требования к оборудованию, особенно для малых и средних масштабов, что делает их подходящими для высокопроизводительного потребительского оборудования (например, RTX 4090).
  • Полномасштабные модели предъявляют чрезвычайно высокие требования к оборудованию, особенно сверхбольшие модели, которые полагаются на профессиональное оборудование (например, H100 GPU).
  • В целом, технология дистилляции значительно снижает требования к оборудованию и повышает гибкость развёртывания моделей, но полномасштабные модели по-прежнему требуют очень высокопроизводительного оборудования для достижения пиковой производительности.

Если вы считаете покупку GPU или самостоятельное развёртывание слишком сложными, вы можете воспользоваться услугами GPU и API от Novita AI, которые предлагают полностью оптимизированную версию DeepSeek-R1. Это крайне удобно и оплачивается по количеству токенов.

Выбор Novita AI для облачных GPU-услуг

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также предлагает доступные и надёжные облачные GPU для создания и масштабирования.

Шаг 1: Зарегистрируйте аккаунт

Если вы новичок в Novita AI, начните с создания аккаунта на нашем сайте. После регистрации перейдите на вкладку «GPUs», чтобы изучить доступные ресурсы и начать свой путь.

Novita AI website screenshot

Шаг 2: Изучение шаблонов и GPU-серверов

Начните с выбора шаблона, соответствующего потребностям вашего проекта, например PyTorch, TensorFlow или CUDA. Выберите версию, подходящую для ваших требований, например PyTorch 2.2.1 или CUDA 11.8.0. Затем выберите конфигурацию GPU-сервера A100, которая обеспечивает высокую производительность для обработки ресурсоёмких задач с достаточным объёмом VRAM, RAM и дискового пространства.

novita ai website screenshot using cloud gpu

Попробуйте высокопроизводительные GPU Novita AI

Шаг 3: Настройка развёртывания

После выбора шаблона и GPU настройте параметры развёртывания, откорректировав такие параметры, как версия операционной системы (например, CUDA 11.8). Вы также можете настроить другие параметры, чтобы адаптировать среду под конкретные требования вашего проекта.

novita ai website screenshot using cloud gpu

Шаг 4: Запуск экземпляра

После того как вы окончательно выбрали шаблон и параметры развёртывания, нажмите «Launch Instance» (Запустить экземпляр), чтобы настроить ваш GPU-экземпляр. Это запустит процесс настройки среды, позволяя вам начать использовать GPU-ресурсы для ваших задач ИИ.

novita ai website screenshot using cloud gpu

Выбор Novita AI для API-услуг

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также предлагает доступные и надёжные облачные GPU для создания и масштабирования.

Шаг 1: Войдите в систему и откройте библиотеку моделей

Войдите в свой аккаунт и нажмите кнопку Model Library (Библиотека моделей).

Log In and Access the Model Library

Попробуйте DeepSeek R1 Demo сейчас!

Шаг 2: Выберите свою модель

Просмотрите доступные варианты и выберите модель, соответствующую вашим потребностям.

Шаг 3: Начните бесплатную пробную версию

Начните бесплатную пробную версию, чтобы изучить возможности выбранной модели.

start a free trail

Шаг 4: Получите ваш API-ключ

Для аутентификации через API мы предоставим вам новый API-ключ. Перейдя на страницу «Settings» (Настройки), вы можете скопировать API-ключ, как показано на изображении.

get api key

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

install api

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Это пример использования API chat completions для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Novita AI совершает революцию в развёртывании ИИ с помощью DeepSeek R1 Turbo, обеспечивая 3-кратную пропускную способность и поддержку расширенных функций, таких как вызов функций (function calling), теперь доступных с ограниченной по времени скидкой 20%. Независимо от того, запускаете ли вы дистиллированные модели на потребительских GPU, таких как RTX 4090, или развёртываете полномасштабные модели на корпоративных H100 GPU, Novita AI обеспечивает непревзойдённую гибкость. Для тех, кто ищет беспроблемное решение, GPU и API-услуги Novita AI предлагают полностью оптимизированную версию DeepSeek R1 Turbo в сочетании с ценообразованием на основе токенов и бесплатной пробной версией. Оцените производительность ИИ нового уровня с DeepSeek R1 Turbo — начните с Novita AI уже сегодня!

Часто задаваемые вопросы

Что такое DeepSeek R1 Turbo?

DeepSeek R1 Turbo — это оптимизированная версия DeepSeek R1, обеспечивающая 3-кратную пропускную способность, полную поддержку вызова функций и ограниченную по времени скидку 20% на Novita AI!

Какое оборудование необходимо для запуска DeepSeek R1?

Полномасштабные модели: Требуют корпоративных GPU, таких как H100, для оптимальной производительности.

Могу ли я попробовать DeepSeek R1 бесплатно?

Да, Novita AI предлагает бесплатную пробную версию DeepSeek R1 через свою API-платформу.

Novita AI — это универсальная облачная платформа, которая поддерживает ваши амбиции в области ИИ. Интегрированные API, бессерверные вычисления, GPU-инстансы — экономически эффективные инструменты, которые вам нужны. Устраните инфраструктурные барьеры, начните бесплатно и воплотите своё видение ИИ в реальность.

Рекомендуемое чтение