4 способа бесплатного использования DeepSeek R1

4 способа бесплатного использования DeepSeek R1

Ключевые моменты

Передовая производительность: превосходит в бенчмарках по математике и программированию.

Открытый исходный код: доступен для исследований, модификации и развертывания.

Экономическая эффективность: предлагает производительность, сравнимую с OpenAI o1, при значительно меньшей стоимости.

4 бесплатных способа: онлайн-платформы, локальный запуск, API, AI Playgrounds.

DeepSeek R1 — это передовая модель рассуждений, созданная для конкуренции с OpenAI o1. Она отлично справляется со сложными задачами, такими как логические выводы, математика и программирование. Благодаря открытому исходному коду и фокусу на продвинутых способностях к рассуждению, она становится очень ценным инструментом для разработчиков и бизнеса. Однако R1 стоит дороже по сравнению с DeepSeek V3. Чтобы помочь вам начать, вот четыре бесплатных способа изучить и использовать DeepSeek R1.

Обзор DeepSeek R1

DeepSeek-R1 предназначена для решения задач, требующих логического мышления, продвинутой математики и программирования. Она основана на DeepSeek-R1-Zero и сочетает обучение с подкреплением с контролируемой точной настройкой для улучшения ясности и связности выводов. DeepSeek-R1 достигает производительности, сравнимой с OpenAI o1, в задачах по математике, коду и рассуждениям.

Получите $20 кредитов и начните бесплатный пробный период DeepSeek R1 прямо сейчас!

Ключевые особенности

  • Размер модели: 671 млрд параметров (37 млрд активных на токен)
  • Токенизатор: улучшенный токенизатор с тегами саморефлексии
  • Поддерживаемые языки: многоязычный с культурной адаптацией
  • Мультимодальность: только текст
  • Контекстное окно: 128 тыс. токенов
  • Форматы хранения: поддержка квантования Q8/Q5
  • Архитектура: смесь экспертов (MoE) + конвейер обучения с усилением RL
  • Метод обучения: построен на основе V3 с конвейером RL (SFT → RL → SFT → RL)
  • Обучающие данные: база V3 + данные оптимизации RL

Бенчмарки производительности

DeepSeek-R1 отлично показывает себя в математике, достигая лучших результатов — 97,3% на MATH-500 и 79,8% на AIME 2024, превосходя конкурентов. В программировании она выделяется показателями 49,2% на SWE-bench Verified и 65,9% на Live Code Bench, демонстрируя всестороннюю экспертизу в обеих областях.

Бенчмарк DeepSeek R1

Все модели оцениваются с максимальной длиной генерации 32 768 токенов, с использованием определенных параметров выборки (температура 0,6, top-p 0,95 и 64 ответа на запрос) для вычисления pass@1 в бенчмарках.

Модели DeepSeek-R1-Distill

Дистилляция, или перенос знаний, — это метод машинного обучения, который передает знания от большой модели к меньшей. Цель — разработать более эффективную модель, способную достичь производительности, близкой к большой модели.

DeepSeek также выпустил дистиллированные версии R1, предлагая меньшие модели, которые сохраняют большую часть возможностей оригинальной модели, будучи при этом более вычислительно эффективными. Эти модели точно настроены с использованием данных, сгенерированных DeepSeek-R1, и доступны в размерах от 1,5 до 70 млрд параметров.

Бенчмарк моделей DeepSeek-R1-Distill

Источник: релизная статья DeepSeek

1. Используйте онлайн-платформы для доступа к DeepSeek R1 (например, Novita AI)

Вы можете получить доступ к DeepSeek-R1 через платформу Novita AI, которая предоставляет простой способ взаимодействия с моделью. Для начала просто перейдите на страницу чата и зарегистрируйтесь. Однако обратите внимание, что онлайн-платформа не поддерживает сохранение истории чата между сессиями.

Кроме того, Novita AI предлагает панель настройки параметров, позволяя вам изменять такие параметры, как максимальное количество токенов, температура и другие, в соответствии с вашими конкретными задачами.

Получите $20 кредитов в Novita AI прямо сейчас!

2. Запустите DeepSeek R1 локально

1. Установите Ollama

  • Посетите сайт Ollama, загрузите и установите версию для вашей ОС.

2. Загрузите модель DeepSeek-R1

  • Откройте терминал и выполните (на примере версии с 7 млрд параметров): bashCopyollama run deepseek-r1:7b (Дождитесь завершения загрузки; время зависит от скорости сети.)
ollama run deepseek-r1:7b

3. Проверьте и запустите

  • Проверка установки:
ollama list  # Проверьте, появился ли "deepseek-r1" в списке
  • Запуск модели:
ollama run deepseek-r1:7b

4. Примеры использования

  • Задайте вопрос: bashCopy>>> "Объясните квантовые вычисления простыми словами."
  • Сгенерируйте код: bashCopy>>> "Напишите функцию на Python для вычисления последовательности Фибоначчи."

3. Получите доступ к бесплатным API DeepSeek R1 (например, Novita AI)

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надежное GPU-облако для создания и масштабирования.

Шаг 1: Войдите и откройте библиотеку моделей

Войдите в свою учетную запись и нажмите кнопку Библиотека моделей.

Войдите и откройте библиотеку моделей

Шаг 2: Выберите модель

Просмотрите доступные варианты и выберите модель, которая соответствует вашим потребностям.

выберите модель

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

начать бесплатный пробный период с R1

Шаг 4: Получите свой API-ключ

Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу «Настройки», чтобы скопировать API-ключ, как показано на изображении.

получить api-ключ

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

установить api

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Это пример использования API чат-завершений для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<ВАШ API-ключ Novita AI>",
)

model = "deepseek/deepseek_r1"
stream = True # или False
max_tokens = 2048
system_content = """Будьте полезным помощником"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Привет!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

4. Протестируйте DeepSeek R1 на Hugging Face

Шаг 1: Настройте API-ключи

  • Перейдите в настройки своей учетной записи, чтобы управлять API-ключами.
  • Добавьте свои пользовательские API-ключи Novita AI в Hugging Face.

Настройте API-ключи в Hugging Face

Шаг 2: Выберите режим Inference API

  • Режим собственного ключа: запросы отправляются напрямую провайдеру вывода с использованием вашего собственного API-ключа.
  • Режим HF-Routed: в этом режиме токен провайдера не требуется. Плата списывается с вашей учетной записи Hugging Face, а не с учетной записи провайдера.

Выберите режим Inference API

Шаг 3: Изучите совместимых провайдеров на страницах моделей

  • На страницах моделей отображаются сторонние провайдеры вывода, совместимые с выбранной моделью (те, которые совместимы с текущей моделью, отсортированы по предпочтениям пользователя).

Изучите совместимых провайдеров на страницах моделей в Hugging Face

Экспериментирование на AI Playgrounds — отличный способ изучить возможности моделей Llama 3 без необходимости продвинутых технических навыков или настройки. Используете ли вы HuggingChat для творческих проектов, Meta AI Web для бесшовной интеграции в повседневные приложения или Perplexity Labs для расширенных экспериментов, эти платформы делают передовой ИИ доступным и практичным для пользователей любого уровня.

Часто задаваемые вопросы

Лучше ли DeepSeek R1, чем OpenAI o1?

DeepSeek R1 предлагает сравнимую производительность, особенно в задачах рассуждения, и является открытым и более экономичным.

Какие задачи лучше всего подходят для DeepSeek R1?

Задачи, требующие интенсивного рассуждения, такие как решение математических задач, программирование и отраслевые приложения.

Можно ли донастроить DeepSeek-R1 для конкретных задач или отраслей?

Да, DeepSeek-R1 можно донастроить для конкретных задач при наличии необходимых вычислительных ресурсов и данных.

Novita AI — это универсальная облачная платформа, которая поддерживает ваши амбиции в области ИИ. Интегрированные API, бессерверные вычисления, GPU-инстансы — экономичные инструменты, которые вам нужны. Устраните инфраструктурные сложности, начните бесплатно и воплотите свое видение ИИ в реальность.

Рекомендуем к прочтению