English Arabic 简体中文 繁體中文 Français Deutsch 日本語 한국어 Português Русский Español

Как получить доступ к DeepSeek R1 локально или через API: Полное руководство

Как получить доступ к DeepSeek R1 локально или через API: Полное руководство

Ключевые моменты

1. Передовая производительность
Превосходное рассуждение: Доминирует в бенчмарках по математике (AIME 2024, MATH-500) и программированию (Codeforces).
Архитектура: MoE + RL-улучшенное обучение с 671B параметров (37B активных на токен).

2. Локальный доступ через Ollama
Установите Ollama; Выполните ollama run deepseek-r1:7b для загрузки; Проверьте с помощью ollama list и взаимодействуйте через терминал.

3. Проблемы локального развертывания
Оборудование: Требуются высокопроизводительные GPU (например, H800) с 24GB+ VRAM.
Память: 671B параметров замедляют загрузку; риск подкачки на диск.
Настройка: Ручная установка весов, библиотек и конфигурации.
Дистиллированные модели: Меньшие версии (например, Qwen-32B) снижают требования к ресурсам, но жертвуют производительностью.

4. Доступ через API: Novita AI предлагает API для DeepSeek R1. Просто зарегистрируйтесь для бесплатного пробного периода и используйте API с простыми запросами.

DeepSeek R1 — это передовая модель ИИ, известная своими сильными способностями к рассуждению, особенно в математике и программировании. Эта статья проведет вас через различные способы доступа к DeepSeek R1: локально или через API.

Что такое DeepSeek R1?

  • Дата выхода: 21 января 2025 г.
  • Масштаб модели:
  • Ключевые особенности:
    • Размер модели: 671B параметров (37B активных на токен)
    • Токенизатор: Улучшенный токенизатор с тегами саморефлексии
    • Поддерживаемые языки: Многоязычный с культурной адаптацией
    • Мультимодальность: Только текст
    • Контекстное окно: 128K токенов
    • Форматы хранения: Поддержка квантизации Q8/Q5
    • Архитектура: Mixture of Experts (MoE) + RL-улучшенный пайплайн обучения
    • Метод обучения: Построен на базе V3 с RL-пайплайном (SFT → RL → SFT → RL)
    • Обучающие данные: База V3 + данные оптимизации RL

https://www.youtube.com/watch?v=ApvcIYDgXzg

Сравнение бенчмарков

DeepSeek-R1 демонстрирует превосходную производительность в большинстве тестов, особенно в задачах, требующих высокой точности и сложных рассуждений (таких как AIME 2024, Codeforces, MATH-500 и MMLU). Он превосходит такие модели, как OpenAI-o1-1217 и OpenAI-o1-mini в этих областях. Однако DeepSeek-R1 показывает более слабые результаты в конкретных задачах, таких как GPQA Diamond и SWE-bench Verified, что указывает на потенциальные области для улучшения по сравнению с моделями вроде Open AI O1.

Применение

  • Решение математических задач и генерация кода.
  • Задачи сложного логического рассуждения.
  • Помощь в диагностике сложных проблем.
  • Анализ многошаговых сценариев.
  • Синтез инсайтов из больших наборов данных.
  • Приложения для обслуживания клиентов.

Как получить доступ к DeepSeek R1 локально

https://www.youtube.com/watch?v=pbCQnDDj-bo

Пошаговая инструкция по установке

1. Установите Ollama

  • Перейдите на сайт Ollama, скачайте и установите версию для вашей ОС.

2. Загрузите модель DeepSeek-R1

  • Откройте терминал и выполните (на примере версии с 7B параметров): bashCopyollama run deepseek-r1:7b (Дождитесь завершения загрузки; время зависит от скорости сети.)
ollama run deepseek-r1:7b

3. Проверьте и запустите

  • Проверка установки:
ollama list  # Проверьте, появился ли "deepseek-r1" в списке
  • Запустите модель:
ollama run deepseek-r1:7b

4. Примеры использования

  • Задайте вопрос: bashCopy>>> "Explain quantum computing in simple terms."
  • Сгенерируйте код: bashCopy>>> "Write a Python function to calculate the Fibonacci sequence."

Проблемы локального развертывания

1. Ограничения оборудования

  • Высокие требования к ресурсам:
    • Требуются высокопроизводительные GPU/TPU (например, H800) с большим объемом VRAM/RAM.
  • Ограничения памяти:
    • 671B параметров (37B активируется на токен) приводят к медленной загрузке.
    • Недостаточный объем VRAM/RAM вызывает подкачку на диск или сбой.

2. Настройка и конфигурация

  • Сложная установка:
    • Ручные шаги: загрузка весов модели (Hugging Face), установка библиотек (например, transformers), настройка фреймворков.
    • Требуются технические знания для оптимизации.
  • Оптимизация программного обеспечения:
    • Необходимо принудительно начинать ответы с thinking, чтобы обеспечить правильные шаблоны рассуждения.

3. Узкие места производительности

  • Медленный вывод:
    • Ограничения CPU/GPU и пропускной способности памяти снижают скорость обработки.
  • Затраты на обслуживание:
    • Ручное обновление для новых версий модели требует постоянных усилий.

4. Компромиссы с дистиллированными моделями

  • Снижение потребности в ресурсах:
    • Меньшие версии (например, Qwen-32B, Llama-70B) снижают требования к оборудованию.
    • Пример: Qwen-32B превосходит OpenAI-o1-mini в бенчмарках.
  • Недостатки производительности:
    • Жертвуют точностью или возможностями по сравнению с полной моделью на 671B.
    • Могут испытывать трудности со сложными задачами, требующими глубокого рассуждения.
Для полной функциональности: выберите доступ через API, чтобы избежать проблем с оборудованием и настройкой.

Как получить доступ к DeepSeek R1 через Novita AI

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развертывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надежное GPU-облако для создания и масштабирования.

Шаг 1: Войдите в систему и получите доступ к библиотеке моделей

Войдите в свою учетную запись и нажмите кнопку Model Library (Библиотека моделей).

Войдите в систему и получите доступ к библиотеке моделей

Попробовать демо DeepSeek R1 сейчас!

Шаг 2: Выберите свою модель

Просмотрите доступные варианты и выберите модель, соответствующую вашим потребностям.

выбор модели

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

начать бесплатный пробный период на r1

Шаг 4: Получите ключ API

Для аутентификации в API мы предоставим вам новый ключ API. Перейдите на страницу «Settings» (Настройки), где вы можете скопировать ключ API, как показано на изображении.

получить ключ API

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, подходящего для вашего языка программирования.

установка API

После установки импортируйте необходимые библиотеки в среду разработки. Инициализируйте API с помощью вашего ключа API, чтобы начать взаимодействие с Novita AI LLM. Это пример использования chat completions API для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)
  
  

При регистрации Novita AI предоставляет кредит в размере $0.5, чтобы вы могли начать работу!

Если бесплатные кредиты закончатся, вы можете оплатить дальнейшее использование.

Какие методы подходят вам?

  • Исследователи: Локальный доступ обычно предпочтителен для гибкости и контроля над экспериментами.

  • Разработчики:

    • Доступ через API подходит для создания приложений и быстрого прототипирования.
    • Локальный доступ лучше подходит для тонкой настройки и пользовательских рабочих процессов.
  • Бизнес: Доступ через API выгоден для быстрой интеграции в сервисы без высоких первоначальных затрат. Локальное развертывание может подойти командам с постоянными требованиями и возможностью инвестировать в инфраструктуру.

  • Небольшие команды/частные лица: Доступ через API обычно более практичен из-за более низких стартовых затрат.

  • Пользователи с ограниченными техническими навыками: Доступ через API предпочтителен, так как устраняет необходимость в глубоких технических знаниях.

В заключение, DeepSeek R1 — это впечатляющая модель с передовыми способностями к рассуждению. Независимо от того, решите ли вы запускать её локально или использовать API, вам нужно будет учитывать компромиссы между контролем, стоимостью и удобством. Тщательно взвесив эти факторы и конкретные рекомендации из этой статьи, вы сможете выбрать наилучший метод доступа для ваших целей.

Часто задаваемые вопросы

DeepSeek R1 лучше, чем OpenAI o1?

DeepSeek R1 предлагает сопоставимую производительность, особенно в задачах рассуждения, с дополнительным преимуществом в виде открытого исходного кода и более низкой стоимости.

Как я могу донастроить DeepSeek R1?

Будучи моделью с открытым исходным кодом, DeepSeek R1 можно донастроить для конкретных задач, при условии наличия вычислительных ресурсов и данных.

Как обучаются модели?

DeepSeek R1 значительно дешевле, чем модели OpenAI o1.

Novita AI — это универсальная облачная платформа, которая расширяет ваши AI-амбиции. Интегрированные API, безсерверные решения, GPU-инстансы — экономически эффективные инструменты, которые вам нужны. Устраните инфраструктуру, начните бесплатно и воплотите свое AI-видение в реальность.

Рекомендуемое чтение